loading...
发表时间: 2024-05-13 13:51:21
少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。
俗语说:“有图有真相”,但随着生成式AI愈来愈流行,用户可以轻松地利用AI工具产制以假乱真的图片后,此说法已开始站不住脚了!为降低假图片、假消息等不良信息的传播风险,Google、OpenAI等科技巨头已先后替AI生成内容加入数码水印,帮助用户确认图片是否为AI产制。数码水印是什么呢?它是否真的可以有效地帮助人们辨识图片真伪?
建立内容凭证缓解AI假图乱象
2023年3月,网上疯传天主教教宗方济各身穿白色羽绒外套、戴上墨镜的图片,让人误以为教宗想改变形象,但这其实是网民使用AI制图工具Midjourney生成的影像,外界称之为全球首宗大规模AI假消息传播事件。2024年1月,诈骗集团利用深伪(Deepfake)技术冒充一家跨国企业的财务长,透过视频会议要求香港员工将钱转入指定的银行账户,骗取约2亿港元(2,600万美元),这是香港首起深伪诈骗案件。
网民Pablo Xavier利用Midjourney产生教宗方济各身穿白色羽绒外套的照片,一度在社交媒体上疯传。(相片来源:Facebook@Guerrero Art)
为遏制上述乱象,AI科技巨头与影像产业公司遂着手制定内容凭证标准,藉由数码水印技术,在AI生成作品中加入一些人眼不可见的信息,惟用户可以透过特殊工具识别该作品是否由AI产制。这种AI内容识别技术可以分为3大阵营,分别为Google的SynthID技术、C2PA联盟的内容凭证、以及IPTC的元数据。
添加SynthID水印无损画质
由Google DeepMind开发的SynthID技术,依靠两个深度学习AI模型来运行:第一个为水印产生模型,使用嵌入式水印技术,将数码水印直接添加到AI产生的内容,过程中会将水印与原始内容对齐,以提高水印的不可察觉性;第二个为识别模型,能够扫描影像或音频中的水印,藉此辨识数码作品是否由AI生成。
添加SynthID水印后,影像画质不会受损。就算影像曾被裁切、加入滤镜、更改颜色、甚至使用有损压缩方案来储存档案,水印依然会存在。目前可被加上SynthID的影像只限由Google制图工具Imagen所产生的作品,同时该公司亦表示这项技术“并非万无一失”且“并不完美”。
影像被添加肉眼不可见的SynthID水印后,画质不会受到丝毫损害。(相片来源:Google官方网志)
即使图片被加入多重滤镜,影像中暗藏的SynthID水印依然无法去除。(相片来源:Google官方网志)
点击CR凭证图标查看影像来源
另一AI内容识别技术是来自C2PA,其全名是“Coalition for Content Provenance and Authenticity”(内容来源和真实性联盟)。这是由Adobe发起的技术联盟,成员包括:Nikon、Leica、Microsoft、Intel、ARM等。
这个联盟建立一个名为“内容凭证”(Content cRedentials,CR)的开放性标准,任何厂商均可以遵循标准替图片、影片或文件档案嵌入数码内容标记。当支持CR凭证的网站发现影像中含有凭证标记,即会在影像右上方加入“cr”图标;用户点击图标,即可以查看影像的来源信息,确认作品是否由AI产生。
由Adobe Firefly生成的影像作品,右上方均会嵌入“cr”图标,可供用户查看影像的来源信息。(相片来源:Adobe官网)
即使刊登图片的网站不支持CR凭证识别,用户也可以把图片拿到C2PA提供的验证网站进行辨识,读取内里的凭证信息。再者,CR凭证亦会记下影像的编辑历史,让用户可以追踪图片的详细变化记录。OpenAI表示,2024年初已替AI绘图工具DALL·E 3加入CR凭证功能,未来更会把这项识别技术整合到影片生成模型Sora。此外,Adobe影像生成模型Firefly产制的作品,也会自动加插入CR凭证。
IPTC元数据支持性最为广泛
最后要介绍的是一项较古旧、但支持性却更广泛的内容识别技术——IPTC元数据(Metadata)。国际新闻及通讯组织IPTC(International Press Telecommunications Council)在1990年订定一项描述多媒体状况的信息标准,里面定义了照片标题、照片描述、分类标签、摄影师与版权等信息栏目。
IPTC在影像业界已成为广泛采用的标准,譬如《Photoshop》就可以直接编辑相片中的IPTC信息。Google I/O 2023开发者大会上,该公司表示计划在Google图片搜寻结果中参考IPTC数据来标记图片。Midjourney、Stability AI、Shutterstock亦已宣布采用IPTC元数据来标记其AI生成内容。
互联网一切事物不再是眼见为实
虽然业界已研发出各种AI识别水印,但美国马里兰大学计算器科学教授苏希尔·费兹(Soheil Feizi)却指出,目前没有任何一款水印是完全可靠的,有心人仍可以想方设法绕过水印,这情况就好比信息安全公司与黑客之间长年累月的网络攻防战。
此外,当AI生成内容被插入到人类创作的作品中,水印应该如何标注将是一大挑战。假如有人将真实录制的录音档放入经过AI处理的照片或影片上,那么平台就要弄清楚如何标记哪个部分是AI产生的、哪个部分是人类制作的,这将是一项非常繁琐、易犯错、兼且具争议性的任务。尽管如此,有水印总比没有好,至少可以让公众意识到,在AI时代下网上一切事物不再是眼见为实!
《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。