有图未必有真相？AI生成假图触发不实信息传播危机-智城物语-经济通中国站

您现在所在的位置：首页 > 香港脉搏 > 理财／管理 > 智城物语 > 有图未必有真相？AI生成假图触发不实信息传播危机

理财／管理智城物语

打印本文章

字体:小中大

有图未必有真相？AI生成假图触发不实信息传播危机

作者：方展策

评论：1

点击率：82170

发表时间: 2024-05-13 13:51:21

作者介绍

少年时，曾研习 Geographic Information System，可惜学无所成，侥幸毕业。成年后，误打误撞进入传媒圈子，先后在印刷、电子、网络媒体打滚，略有小成。中年后，修毕信息科技硕士，眼界渐扩，决意投身初创企业，窥探不同科技领域。近年，积极钻研数据分析与数码策略，又涉足 Location Intelligence 开发项目；有时还会抽空执教鞭，既可向他人分享所学，亦可鞭策自己保持终身学习。

俗语说：“有图有真相”，但随着生成式AI愈来愈流行，用户可以轻松地利用AI工具产制以假乱真的图片后，此说法已开始站不住脚了！为降低假图片、假消息等不良信息的传播风险，Google、OpenAI等科技巨头已先后替AI生成内容加入数码水印，帮助用户确认图片是否为AI产制。数码水印是什么呢？它是否真的可以有效地帮助人们辨识图片真伪？

建立内容凭证缓解AI假图乱象

2023年3月，网上疯传天主教教宗方济各身穿白色羽绒外套、戴上墨镜的图片，让人误以为教宗想改变形象，但这其实是网民使用AI制图工具Midjourney生成的影像，外界称之为全球首宗大规模AI假消息传播事件。2024年1月，诈骗集团利用深伪（Deepfake）技术冒充一家跨国企业的财务长，透过视频会议要求香港员工将钱转入指定的银行账户，骗取约2亿港元（2,600万美元），这是香港首起深伪诈骗案件。

网民Pablo Xavier利用Midjourney产生教宗方济各身穿白色羽绒外套的照片，一度在社交媒体上疯传。（相片来源：Facebook@Guerrero Art）

为遏制上述乱象，AI科技巨头与影像产业公司遂着手制定内容凭证标准，藉由数码水印技术，在AI生成作品中加入一些人眼不可见的信息，惟用户可以透过特殊工具识别该作品是否由AI产制。这种AI内容识别技术可以分为3大阵营，分别为Google的SynthID技术、C2PA联盟的内容凭证、以及IPTC的元数据。

添加SynthID水印无损画质

由Google DeepMind开发的SynthID技术，依靠两个深度学习AI模型来运行：第一个为水印产生模型，使用嵌入式水印技术，将数码水印直接添加到AI产生的内容，过程中会将水印与原始内容对齐，以提高水印的不可察觉性；第二个为识别模型，能够扫描影像或音频中的水印，藉此辨识数码作品是否由AI生成。

添加SynthID水印后，影像画质不会受损。就算影像曾被裁切、加入滤镜、更改颜色、甚至使用有损压缩方案来储存档案，水印依然会存在。目前可被加上SynthID的影像只限由Google制图工具Imagen所产生的作品，同时该公司亦表示这项技术“并非万无一失”且“并不完美”。

影像被添加肉眼不可见的SynthID水印后，画质不会受到丝毫损害。（相片来源：Google官方网志）

即使图片被加入多重滤镜，影像中暗藏的SynthID水印依然无法去除。（相片来源：Google官方网志）

点击CR凭证图标查看影像来源

另一AI内容识别技术是来自C2PA，其全名是“Coalition for Content Provenance and Authenticity”（内容来源和真实性联盟）。这是由Adobe发起的技术联盟，成员包括：Nikon、Leica、Microsoft、Intel、ARM等。

这个联盟建立一个名为“内容凭证”（Content cRedentials，CR）的开放性标准，任何厂商均可以遵循标准替图片、影片或文件档案嵌入数码内容标记。当支持CR凭证的网站发现影像中含有凭证标记，即会在影像右上方加入“cr”图标；用户点击图标，即可以查看影像的来源信息，确认作品是否由AI产生。

由Adobe Firefly生成的影像作品，右上方均会嵌入“cr”图标，可供用户查看影像的来源信息。（相片来源：Adobe官网）

即使刊登图片的网站不支持CR凭证识别，用户也可以把图片拿到C2PA提供的验证网站进行辨识，读取内里的凭证信息。再者，CR凭证亦会记下影像的编辑历史，让用户可以追踪图片的详细变化记录。OpenAI表示，2024年初已替AI绘图工具DALL·E 3加入CR凭证功能，未来更会把这项识别技术整合到影片生成模型Sora。此外，Adobe影像生成模型Firefly产制的作品，也会自动加插入CR凭证。

IPTC元数据支持性最为广泛

最后要介绍的是一项较古旧、但支持性却更广泛的内容识别技术——IPTC元数据（Metadata）。国际新闻及通讯组织IPTC（International Press Telecommunications Council）在1990年订定一项描述多媒体状况的信息标准，里面定义了照片标题、照片描述、分类标签、摄影师与版权等信息栏目。

IPTC在影像业界已成为广泛采用的标准，譬如《Photoshop》就可以直接编辑相片中的IPTC信息。Google I／O 2023开发者大会上，该公司表示计划在Google图片搜寻结果中参考IPTC数据来标记图片。Midjourney、Stability AI、Shutterstock亦已宣布采用IPTC元数据来标记其AI生成内容。

互联网一切事物不再是眼见为实

虽然业界已研发出各种AI识别水印，但美国马里兰大学计算器科学教授苏希尔·费兹（Soheil Feizi）却指出，目前没有任何一款水印是完全可靠的，有心人仍可以想方设法绕过水印，这情况就好比信息安全公司与黑客之间长年累月的网络攻防战。

此外，当AI生成内容被插入到人类创作的作品中，水印应该如何标注将是一大挑战。假如有人将真实录制的录音档放入经过AI处理的照片或影片上，那么平台就要弄清楚如何标记哪个部分是AI产生的、哪个部分是人类制作的，这将是一项非常繁琐、易犯错、兼且具争议性的任务。尽管如此，有水印总比没有好，至少可以让公众意识到，在AI时代下网上一切事物不再是眼见为实！

《经济通》所刊的署名及／或不署名文章，相关内容属作者个人意见，并不代表《经济通》立场，《经济通》所扮演的角色是提供一个自由言论平台。