OpenAI接连被告！ChatGPT涉嫌诽谤、侵权、损害私隐-智城物语-经济通中国站

您现在所在的位置：首页 > 香港脉搏 > 理财／管理 > 智城物语 > OpenAI接连被告！ChatGPT涉嫌诽谤、侵权、损害私隐

理财／管理智城物语

打印本文章

字体:小中大

OpenAI接连被告！ChatGPT涉嫌诽谤、侵权、损害私隐

作者：方展策

评论：0

点击率：45102

发表时间: 2023-08-07 16:32:09

作者介绍

少年时，曾研习 Geographic Information System，可惜学无所成，侥幸毕业。成年后，误打误撞进入传媒圈子，先后在印刷、电子、网络媒体打滚，略有小成。中年后，修毕信息科技硕士，眼界渐扩，决意投身初创企业，窥探不同科技领域。近年，积极钻研数据分析与数码策略，又涉足 Location Intelligence 开发项目；有时还会抽空执教鞭，既可向他人分享所学，亦可鞭策自己保持终身学习。

曾使用ChatGPT的人可能发现，它偶尔会乱说话，编造假信息。如你以玩乐心态操作，看到它一本正经地“说出”失实答案，还真是很搞笑的；但当这些假信息牵涉到有名有姓的真实人物，当事人就觉得一点都不好玩了。另一方面，OpenAI从互联网抓取数据来训练AI模型，当中难免包含受版权保护的内容，让众多作家深感不满。因此，愈来愈多知名人士、作家对该公司提起诽谤、侵权诉讼。面对这波诉讼浪潮，被誉为“ChatGPT之父”的奥特曼要如何应对呢？

ChatGPT捏造案件面临诽谤诉讼

枪械刊物《AmmoLand》的主编弗雷德·里尔（Fred Riehl）在2023年5月撰写一篇“第二修正案基金会（SAF）诉讼 Robert Ferguson”案件的报道，要求ChatGPT提供案件摘要。根据ChatGPT所述，SAF创办人艾伦·戈特利布（Alan Gottlieb）起诉乔治亚州电台主持人马克·沃尔特斯（Mark Walters），涉嫌以SAF财务长的职权非法挪用基金会的资金。

里尔致电给戈特利布查问是否真有其事，结果对方证实ChatGPT产出的内容完全是错误的。事实上，沃尔特斯既不是“Robert Ferguson”案件的当事人，亦从未任职于第二修正案基金会。沃尔特斯得知此事后，于2023年6月5日决定向OpenAI提起诽谤诉讼。这是全球首宗针对ChatGPT的诽谤索偿起诉，象征着诽谤法例同样适用于生成式AI领域。

ChatGPT胡乱捏造他人犯法已非首次。2023年4月，澳洲维多利亚省赫本郡（Hepburn Shire）市长莱恩·胡德（Brian Hood）发现，ChatGPT错误地把他列为2011年澳洲印钞公司（Note Printing Australia）海外贿赂案的犯人，因贿赂而入狱，让他担心自己的声誉会因此受损。

胡德的代表律师指出，其客户确实曾受雇于澳洲印钞公司，但却是举报高层向外国官员行贿以获取货币印刷合约的吹哨人，而不是犯案者。他表示，已向OpenAI发出律师信，要求对方修改有关其客户的错误，否则便会考虑提出诽谤诉讼。

胡德的代表律师指出，胡德本人作为赫本郡市长，声誉对他至关重要。如果有市民在ChatGPT上看到有关他的错误信息，将给他带来巨大的负面影响。（图片来源：Brian Hood脸书专页）

8,000作家要求AI公司付版权费

面对外界指责ChatGPT编造假信息，OpenAI执行长山姆·奥特曼（Sam Altman）坦承，生成式AI有“信息幻觉”（Hallucination）是一个需要解决的问题，其团队现正积极开发可以减少不实信息产生的新模型。

乔治亚州电台主持人沃尔特斯表示，自己是ChatGPT产生“幻觉”下的受害者。（图片来源：Mark Walters脸书专页）

除诽谤官司外，OpenAI还遭受侵权指控。2023年7月，逾8,000名作家发表联署公开信，要求OpenAI、微软（Microsoft）、Google、Meta等科技公司，为AI所用的版权内容付费。这封由美国最大作者组织作家协会（Authors Guild）发起的公开信指控，用于训练AI模型的书籍内容，大部分来自一些盗版网站，而这些公司未经作者同意，擅自取用其著作的内容，更没有支付过一分钱。

作家协会主席玛雅·尚巴格·朗（Maya Shanbhag Lang）指出，生成式AI输出的内容本质上是衍生物——这是AI吸收人类作家的著作内容后，再重组内容而产出的衍生作品。作家写作内容来“喂养”AI，让它学习和进化，因此而获得补偿是公平的。

作家协会主席尚巴格·朗直言，AI产出的内容本质上只是人类作家的衍生作品。（图片来源：IG@ mayaslang）

公开信中列出对科技公司的3项要求：一、获得生成式AI模型所用的版权内容许可；二、为过往或现在AI模型中所用到的作品给予作者公平补偿；三、为AI生成内容中所用到的作品给予作者公平补偿。尚巴格·朗强调，任何作品不得在未经同意、署名、报酬的情况下使用，三者缺一不可，惟公开信中未有提到任何法律行动。

小说家向OpenAI提起侵权诉讼

不过，有部分作家早已按捺不住，决意诉诸法律行动。2023年6月28日，美国小说作家保罗·特伦布莱（Paul Tremblay）、莫娜·阿瓦德（Mona Awad）对OpenAI提告，控诉OpenAI在没有获得版权授权下，利用他们的作品来训练AI模型。两位作家指出，ChatGPT能够精确地为其小说撰写摘要，代表着他们的作品已被复制到AI模型中，属于侵权行为。该诉讼代表全美国版权所有者，寻求一笔数额不详的赔偿金。

特伦布莱是一位美国小说作家，擅长撰写黑暗奇幻和科幻小说，代表作有《世界尽头的小屋》（The Cabin at the End of the World）。（图片来源：X.com@BookCougars账户）

阿瓦德是一位加拿大小说家，以黑色喜剧小说作品而闻名，代表作包括《兔子》（Bunny）和《看待胖女孩的13种方式》（13 Ways of Looking at a Fat Girl）。（图片来源：Amazon）

目前AI模型是在大量文本数据上进行训练，惟OpenAI从未透露ChatGPT所用的训练数据来源，只表示通常会从互联网抓取资料，包括维基百科、网上档案图书等。两位作家认为，书籍是训练AI的理想材料，因为内里结集了精心编制的高质文章，汇聚人类思想的精华。根据起诉书所述，估计OpenAI的训练数据包含逾30万本书，其中包括版权归属不明、或未获授权的版权书籍。

书本被认为是训练AI模型的最佳材料，因为书中辑录了高质、有深度的长篇文章，储存了人类思想的精华。（图片来源：Pexels图库）

可是，要证明ChatGPT是怎样采集、在哪里采集这些书本内容，以及相关作者是否需承受经济损失，却是非常困难。除书籍外，ChatGPT也运用了大量网上讯息作数据训练，例如网民在社交媒体上对这些书的讨论贴文。因此，就算ChatGPT写出的书籍摘要，跟作品的内容一模一样，亦未必可以证明AI模型内包含了书籍内容。

英国修适士大学（University of Sussex）知识产权法讲师安德烈斯·瓜达穆斯（Andres Guadamuz）表示，这是首宗针对ChatGPT的侵权诉讼，有助于探讨生成式AI领域内行为合法性的问题。美国范德堡大学（Vanderbilt University）法律系教授丹尼尔·贾维斯（Daniel Gervais）预估，未来会有愈来愈多涉及生成式AI的侵权官司出现。

OpenAI擅取个人信息再遭诉讼

同样是6月28日，OpenAI也遭到另一宗性质有点不同的集体诉讼：一群匿名人士指控OpenAI窃取大量个人信息，用于训练其AI模型。克拉克森律师事务所（Clarkson Law Firm）向法院提交的诉状中表示，原告的名字以姓名首字母缩写作为标识。

这群匿名人士指出，OpenAI透过互联网抓取了3,000亿个单词，当中包括个人信息、以及来自X.com(Twitter)和Reddit等社交媒体平台的贴文。虽然用户的个人信息在社交媒体上是公开的，但如果数据被擅自复制到其他平台使用，却属于侵犯私隐行为。

他们估计，受害人数可能高达数百万，涉及30亿美元（约234亿港元）的潜在损失。该诉讼不但寻求金钱赔偿，更要求法院提高OpenAI数据收集和处理、使用个人数据的损害和赔偿、以及用户选择退出数据收集机制的透明度。

华盛顿大学法律学者Inyoung Cheong认为，法院在审判时，要权衡AI技术使用这些内容时所带来的各种风险与益处，故此相关案件可能需要数年时间始能结案。

OpenAI向传媒业界递出橄榄枝

当然，科技公司亦已意识到训练AI模型所涉及的法律风险。如要解决版权问题，跟内容出版商达成协议，取得内容使用许可，可能是最好方法。奥特曼曾经表示，愿意为某些领域的高质内容数据付出高昂代价。

最近OpenAI陆续向传媒及出版业界递出橄榄枝。2023年7月，OpenAI跟美联社（Associated Press）达成为期2年的授权协议，将取得美联社部分新闻报道的用户许可证，内容甚至可以追溯至1985年的新闻。同月，OpenAI宣布向非牟利组织美国新闻计划（American Journalism Project）提供500万美元（约3,900万港元）资金，用于建立一个工作室，帮助地方新闻网站使用AI技术来改善营运。

更有消息指，OpenAI、微软、Google近几个月会晤了新闻业高层，讨论生成式AI工具使用新闻内容的版权问题。美国新闻集团（News Corp）、《纽约时报》集团（New York Times）、英国《卫报》（The Guardian）、以及德国报业集团斯普林格（Axel Springer）等，均至少与一家科技公司商讨合作的可能性。

双方的讨论方向主要围绕着版权费的定价与收费方式。较简单的方式是“按年收费”，有业者开出的价码是介乎500万至2,000万美元（约3,900万至1.56亿港元）的授权年费。另有传媒业高层倾向采用“按量计价”，只要AI模型使用了新闻内容一次，就要付一次钱；但这种收费方式却需要科技公司披露AI模型对内容的使用状况，目前AI业界还没有人这样做。

FTC对OpenAI展开深入调查

在抵御诉讼浪潮的同时，奥特曼一直试图影响政府和立法者，如何制定监管AI的新法例。早前他周游列国向全球各国政府示好，努力为利好AI发展的监管环境打好基础。可惜事与愿违，美国联邦交易委员会（Federal Trade Commission，FTC）于2023年7月决定对OpenAI展开深入调查。这是该公司目前遇到最强力的监管行动。

OpenAI执行长奥特曼早前走访世界各国，拜会当地政府官员和立法者，讨论AI前景和威胁。2023年6月，他会晤了韩国总统尹锡悦和当地约100家初创企业。（图片来源：X.com@sama账户）

联邦贸易委员会表示，OpenAI将民众个人声誉和私隐暴露于危险中，涉嫌触犯消费者保护法，因此必须介入调查。FTC要求OpenAI提供多种公司文件以协助调查，包括：ChatGPT的营销计划、广告部署、训练方法、怎样收集训练AI模型的数据、怎样防止假信息扭曲个人形象、以及怎样防止AI模型泄露个人资料等。奥特曼强调，OpenAI的技术具有高度安全性，并以消费者为重，并表示乐意配合FTC的调查。