香港脉搏www.etnetchina.com.cn
 理财/管理智城物语
打印logo打印本文章电邮logo字体:
分享:
OpenAI接连被告!ChatGPT涉嫌诽谤、侵权、损害私隐
方展策
作者:方展策评论评论:点击率点击率:

发表时间: 2023-08-07 16:32:09

作者介绍

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

   曾使用ChatGPT的人可能发现,它偶尔会乱说话,编造假信息。如你以玩乐心态操作,看到它一本正经地“说出”失实答案,还真是很搞笑的;但当这些假信息牵涉到有名有姓的真实人物,当事人就觉得一点都不好玩了。另一方面,OpenAI从互联网抓取数据来训练AI模型,当中难免包含受版权保护的内容,让众多作家深感不满。因此,愈来愈多知名人士、作家对该公司提起诽谤、侵权诉讼。面对这波诉讼浪潮,被誉为“ChatGPT之父”的奥特曼要如何应对呢?


ChatGPT捏造案件面临诽谤诉讼


   枪械刊物《AmmoLand》的主编弗雷德·里尔(Fred Riehl)在2023年5月撰写一篇“第二修正案基金会(SAF)诉讼 Robert Ferguson”案件的报道,要求ChatGPT提供案件摘要。根据ChatGPT所述,SAF创办人艾伦·戈特利布(Alan Gottlieb)起诉乔治亚州电台主持人马克·沃尔特斯(Mark Walters),涉嫌以SAF财务长的职权非法挪用基金会的资金。


   里尔致电给戈特利布查问是否真有其事,结果对方证实ChatGPT产出的内容完全是错误的。事实上,沃尔特斯既不是“Robert Ferguson”案件的当事人,亦从未任职于第二修正案基金会。沃尔特斯得知此事后,于2023年6月5日决定向OpenAI提起诽谤诉讼。这是全球首宗针对ChatGPT的诽谤索偿起诉,象征着诽谤法例同样适用于生成式AI领域。


   ChatGPT胡乱捏造他人犯法已非首次。2023年4月,澳洲维多利亚省赫本郡(Hepburn Shire)市长莱恩·胡德(Brian Hood)发现,ChatGPT错误地把他列为2011年澳洲印钞公司(Note Printing Australia)海外贿赂案的犯人,因贿赂而入狱,让他担心自己的声誉会因此受损。


   胡德的代表律师指出,其客户确实曾受雇于澳洲印钞公司,但却是举报高层向外国官员行贿以获取货币印刷合约的吹哨人,而不是犯案者。他表示,已向OpenAI发出律师信,要求对方修改有关其客户的错误,否则便会考虑提出诽谤诉讼。


胡德的代表律师指出,胡德本人作为赫本郡市长,声誉对他至关重要。如果有市民在ChatGPT上看到有关他的错误信息,将给他带来巨大的负面影响。(图片来源:Brian Hood脸书专页)


8,000作家要求AI公司付版权费


   面对外界指责ChatGPT编造假信息,OpenAI执行长山姆·奥特曼(Sam Altman)坦承,生成式AI有“信息幻觉”(Hallucination)是一个需要解决的问题,其团队现正积极开发可以减少不实信息产生的新模型。


乔治亚州电台主持人沃尔特斯表示,自己是ChatGPT产生“幻觉”下的受害者。(图片来源:Mark Walters脸书专页)


   除诽谤官司外,OpenAI还遭受侵权指控。2023年7月,逾8,000名作家发表联署公开信,要求OpenAI、微软(Microsoft)、Google、Meta等科技公司,为AI所用的版权内容付费。这封由美国最大作者组织作家协会(Authors Guild)发起的公开信指控,用于训练AI模型的书籍内容,大部分来自一些盗版网站,而这些公司未经作者同意,擅自取用其著作的内容,更没有支付过一分钱。


   作家协会主席玛雅·尚巴格·朗(Maya Shanbhag Lang)指出,生成式AI输出的内容本质上是衍生物——这是AI吸收人类作家的著作内容后,再重组内容而产出的衍生作品。作家写作内容来“喂养”AI,让它学习和进化,因此而获得补偿是公平的。


作家协会主席尚巴格·朗直言,AI产出的内容本质上只是人类作家的衍生作品。(图片来源:IG@ mayaslang)


   公开信中列出对科技公司的3项要求:一、获得生成式AI模型所用的版权内容许可;二、为过往或现在AI模型中所用到的作品给予作者公平补偿;三、为AI生成内容中所用到的作品给予作者公平补偿。尚巴格·朗强调,任何作品不得在未经同意、署名、报酬的情况下使用,三者缺一不可,惟公开信中未有提到任何法律行动。


小说家向OpenAI提起侵权诉讼


   不过,有部分作家早已按捺不住,决意诉诸法律行动。2023年6月28日,美国小说作家保罗·特伦布莱(Paul Tremblay)、莫娜·阿瓦德(Mona Awad)对OpenAI提告,控诉OpenAI在没有获得版权授权下,利用他们的作品来训练AI模型。两位作家指出,ChatGPT能够精确地为其小说撰写摘要,代表着他们的作品已被复制到AI模型中,属于侵权行为。该诉讼代表全美国版权所有者,寻求一笔数额不详的赔偿金。


特伦布莱是一位美国小说作家,擅长撰写黑暗奇幻和科幻小说,代表作有《世界尽头的小屋》(The Cabin at the End of the World)。(图片来源:X.com@BookCougars账户)


阿瓦德是一位加拿大小说家,以黑色喜剧小说作品而闻名,代表作包括《兔子》(Bunny)和《看待胖女孩的13种方式》(13 Ways of Looking at a Fat Girl)。(图片来源:Amazon)


   目前AI模型是在大量文本数据上进行训练,惟OpenAI从未透露ChatGPT所用的训练数据来源,只表示通常会从互联网抓取资料,包括维基百科、网上档案图书等。两位作家认为,书籍是训练AI的理想材料,因为内里结集了精心编制的高质文章,汇聚人类思想的精华。根据起诉书所述,估计OpenAI的训练数据包含逾30万本书,其中包括版权归属不明、或未获授权的版权书籍。


书本被认为是训练AI模型的最佳材料,因为书中辑录了高质、有深度的长篇文章,储存了人类思想的精华。(图片来源:Pexels图库)


   可是,要证明ChatGPT是怎样采集、在哪里采集这些书本内容,以及相关作者是否需承受经济损失,却是非常困难。除书籍外,ChatGPT也运用了大量网上讯息作数据训练,例如网民在社交媒体上对这些书的讨论贴文。因此,就算ChatGPT写出的书籍摘要,跟作品的内容一模一样,亦未必可以证明AI模型内包含了书籍内容。


   英国修适士大学(University of Sussex)知识产权法讲师安德烈斯·瓜达穆斯(Andres Guadamuz)表示,这是首宗针对ChatGPT的侵权诉讼,有助于探讨生成式AI领域内行为合法性的问题。美国范德堡大学(Vanderbilt University)法律系教授丹尼尔·贾维斯(Daniel Gervais)预估,未来会有愈来愈多涉及生成式AI的侵权官司出现。


OpenAI擅取个人信息再遭诉讼


   同样是6月28日,OpenAI也遭到另一宗性质有点不同的集体诉讼:一群匿名人士指控OpenAI窃取大量个人信息,用于训练其AI模型。克拉克森律师事务所(Clarkson Law Firm)向法院提交的诉状中表示,原告的名字以姓名首字母缩写作为标识。


   这群匿名人士指出,OpenAI透过互联网抓取了3,000亿个单词,当中包括个人信息、以及来自X.com(Twitter)和Reddit等社交媒体平台的贴文。虽然用户的个人信息在社交媒体上是公开的,但如果数据被擅自复制到其他平台使用,却属于侵犯私隐行为。


   他们估计,受害人数可能高达数百万,涉及30亿美元(约234亿港元)的潜在损失。该诉讼不但寻求金钱赔偿,更要求法院提高OpenAI数据收集和处理、使用个人数据的损害和赔偿、以及用户选择退出数据收集机制的透明度。


   华盛顿大学法律学者Inyoung Cheong认为,法院在审判时,要权衡AI技术使用这些内容时所带来的各种风险与益处,故此相关案件可能需要数年时间始能结案。


OpenAI向传媒业界递出橄榄枝


   当然,科技公司亦已意识到训练AI模型所涉及的法律风险。如要解决版权问题,跟内容出版商达成协议,取得内容使用许可,可能是最好方法。奥特曼曾经表示,愿意为某些领域的高质内容数据付出高昂代价。


   最近OpenAI陆续向传媒及出版业界递出橄榄枝。2023年7月,OpenAI跟美联社(Associated Press)达成为期2年的授权协议,将取得美联社部分新闻报道的用户许可证,内容甚至可以追溯至1985年的新闻。同月,OpenAI宣布向非牟利组织美国新闻计划(American Journalism Project)提供500万美元(约3,900万港元)资金,用于建立一个工作室,帮助地方新闻网站使用AI技术来改善营运。


   更有消息指,OpenAI、微软、Google近几个月会晤了新闻业高层,讨论生成式AI工具使用新闻内容的版权问题。美国新闻集团(News Corp)、《纽约时报》集团(New York Times)、英国《卫报》(The Guardian)、以及德国报业集团斯普林格(Axel Springer)等,均至少与一家科技公司商讨合作的可能性。


   双方的讨论方向主要围绕着版权费的定价与收费方式。较简单的方式是“按年收费”,有业者开出的价码是介乎500万至2,000万美元(约3,900万至1.56亿港元)的授权年费。另有传媒业高层倾向采用“按量计价”,只要AI模型使用了新闻内容一次,就要付一次钱;但这种收费方式却需要科技公司披露AI模型对内容的使用状况,目前AI业界还没有人这样做。


FTC对OpenAI展开深入调查


   在抵御诉讼浪潮的同时,奥特曼一直试图影响政府和立法者,如何制定监管AI的新法例。早前他周游列国向全球各国政府示好,努力为利好AI发展的监管环境打好基础。可惜事与愿违,美国联邦交易委员会(Federal Trade Commission,FTC)于2023年7月决定对OpenAI展开深入调查。这是该公司目前遇到最强力的监管行动。


OpenAI执行长奥特曼早前走访世界各国,拜会当地政府官员和立法者,讨论AI前景和威胁。2023年6月,他会晤了韩国总统尹锡悦和当地约100家初创企业。(图片来源:X.com@sama账户)


   联邦贸易委员会表示,OpenAI将民众个人声誉和私隐暴露于危险中,涉嫌触犯消费者保护法,因此必须介入调查。FTC要求OpenAI提供多种公司文件以协助调查,包括:ChatGPT的营销计划、广告部署、训练方法、怎样收集训练AI模型的数据、怎样防止假信息扭曲个人形象、以及怎样防止AI模型泄露个人资料等。奥特曼强调,OpenAI的技术具有高度安全性,并以消费者为重,并表示乐意配合FTC的调查。


奥特曼声称,自己是从新闻得知FTC对OpenAI进行调查,认为此举无助建立双方信任,惟他表示,OpenAI仍会与FTC合作协助调查。(图片来源:X.com@sama账户)


   OpenAI遭到FTC调查,意味着不止美国国会,甚至连联邦政府也开始加快对AI的监管步伐。尽管不少人质疑这些规管将窒碍AI发展,但适度监管却可以防止AI造成的安全风险,并可以保护公众私隐和作者版权。由是观之,如何平衡AI发展与公众利益,将成为各国政府未来的重要课题。


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。

分享:
返回智城物语
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  只看作者评论  查看全部评论:↑顺序 ↓倒序
  • 暂无读者评论!
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序  ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目