香港脉搏www.etnetchina.com.cn
 理财/管理智城物语
打印logo打印本文章电邮logo字体:
分享:
输入文字即变超美图!AI制图工具让人人都可以变画家
方展策
作者:方展策评论评论:点击率点击率:

发表时间: 2022-10-17 12:02:56

作者介绍

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

   AI机械人的诞生,原意是代替人类执行单调而重复性高的任务,让人们可以专注于讲求创作力的工作。但如果AI已具备创作能力的话,那么人类又应如何自处?早前,有人利用AI作画工具《Midjourney》,赢得美国科罗拉多博览会的艺术奖项,引发网民激烈辩论:AI演算出来的作品算是艺术创作吗?艺术工作者会否被AI淘汰呢?更有论者指,AI制图便利背后,隐藏着种族与性别歧视、以及侵犯版权等严重问题。


AI算法将文字转化图片


   2022年8月底,毕业于科罗拉多理工大学计算器科学系、几乎没有美术根底的桌上游戏公司老板杰森·艾伦(Jason M. Allen),凭着画作《太空歌剧院》(Théâtre D'opéra Spatial),在美国科罗拉多博览会(Colorado State Fair)年度艺术比赛的“数码艺术”组别中,夺得冠军殊荣。


桌游公司老板杰森·艾伦提交3幅由《MidJourney》生成的画作,参加科罗拉多博览会的年度艺术比赛,结果其中一幅作品《Théâtre D'opéra Spatial》赢得“数码艺术”组别冠军(图片来源:维基百科)。


   这幅带有古典巴洛克风格与科幻电影超现实氛围的作品,画中人物身处黑暗的室内,站在一个圆形巨窗前,凝望着光芒四射的窗外景观,似乎若有所思。表面看来,画作的人物构图、光影表现、以至色彩运用俱佳,能获奖理应毫不奇怪。然而,最大问题是这幅画作不是艾伦本人亲自绘画,而是透过《MidJourney》的AI算法生成。


   《Midjourney》是一款AI图像产生工具,能将用户输入的文字转化为图片(Text-to-image)。用户只要输入想象中图片的文字描述和关键词,AI便会尝试分析和理解输入文字,跟着以最适合这段描述的绘画风格生成4幅图片以供选择,整个过程大概只需1分钟左右。


在Midjourney网站上可以看到其他用户透过AI演算出来的最新画作,当中不乏超逼真、超细致的作品。(图片来源:翻摄Midjourney官网)


AI作品摘艺术赛冠军惹争议


   艾伦表示,参赛时已清楚注明创作工具为《Midjourney》,并强调自己花了逾80个小时,输入900多个不同的关键词组合,针对画面明暗和用色的文字描述进行多番修正,再从中挑出3张合用的图片。


   接着,艾伦使用《Photoshop》微调与润饰这3张图片,譬如AI漏画了其中一个画中人物的头部,需由他后制补上长着深色卷发的头颅;然后,利用《Gigapixel AI》图像处理软件来调高图片解像度;最后,他把编修好的图像档案拿到印刷店印制在画布上,成为参赛作品。


   这次比赛的其中一位评审艺术家卡尔杜兰(Cal Duran)表示,艾伦的作品介绍中确实有提及《Midjourney》,但当时他不知晓这是什么,也不知道画作是由AI生成。但卡尔杜兰却认为,这幅画是“讲述故事、唤醒灵魂”的好作品,因此他与另一位评审都认为,它是实至名归的冠军作品。


   此奖项公布后,在艺术界引起极大争议。不少人质疑,艾伦将AI生成的画作署名为自己作品的合法性,以及容许AI作品入围是否会构成不公平竞赛。也有人批评,藉由无感情的数据演算进行创作,不符合艺术本质,故此不应把AI生成图当作艺术品,否则艺术便会死亡。但科罗拉多州博览会发言人已表示,不会褫夺艾伦的冠军资格。


笔者输入“punk raiding cat”的文字描述,随即看到根据文字而生成的4张缩图逐步渲染;大概1分钟后,4张缩图就生成完毕。(图片来源:Midjourney AI工具)


笔者从4张缩图中选取较满意的再进行放大细节化,最终得出这幅带点“Punk”味的长耳大眼白猫肖像图。(图片来源:Midjourney AI工具)


美编、插画师可能工作不保


   有支持者认为,数码艺术作品本来就要藉助数码工具来完成,《Midjourney》等AI制图工具跟常用的《Photoshop》并无太差异;而且用AI创作仍是基于人类的创造力和想象力,要求操作者在有限字词内精准表达画作的主题、光影与构图,就创作本质来说没什么不同,只是从用画笔绘画,变成以键盘作画而已。


   更有论者认为,艺术工作者透过AI工具可以快速地将脑中想法化为图像,从中提取设计元素绘画成新作品,有助缩短构思时间,提高创作效率。此外,计算机游戏公司也可以使用这类工具来生成游戏场景与角色,加快开发进程。


   不过有些人担忧,若果连艺术创作都可以由AI代劳,那么未来人类是否可以完全被智能机械人取代呢?漫画家马特·波莫(Matt Borrs)表示,对插画家而言,AI作画非常让人沮丧,因为这预告着插画师即将要失业了。


   譬如财经杂志《经济学人》(Economist)在2022年6月以“AI新境界”(AI’s New Frontier)作为封面故事,并首度采用《Midjourney》来制作封面图片。据悉,已有部分外国出版社开始使用AI生成图片,供编辑挑选作内文配相。假如日后AI作画工具被大规模引入到出版界,或许会构成美术编辑、插画师出现人手过剩的问题。


《经济学人》编辑团队在《Midjourney》上经过250次的文字输入尝试,生成了1,000张缩图,再从中挑选出一张制成2022年6月出版的杂志封面图片。(图片来源:Economist官网)


大数据图像训练含偏见风险


   目前市场上的AI制图工具除《Midjourney》外,还有OpenAI的《DALL-E 2》、Google Research的《Imagen》、以及StabilityAI的《Stable Diffusion》,都是只需靠着文字输入,就可以生成各式各样的图像。


   这类工具的运作原理是,AI透过网上图片库内的大量风景、对象、人物照片来进行比对和训练,跟着从中挑选出特定主题和样式,组成不同模板,然后使用这些模板来生成用户输入的图像内容。


   可是,这种大数据图像训练却有机会让AI大量复制数据内的西方文化与性别刻板印象,以致AI生成的图片大都隐含着某些偏见与刻板印象。譬如说,输入“Nurse”一词,AI产生的图像大都是戴着听诊器的女生;输入“CEO”一词,生成的图像几乎全部是白人男性。


   Google的研究报告指出,AI作画工具倾向生成肤色较浅人种的图像,同时对不同职业的描绘亦容易产生特定性别的刻板形象。日后当AI工具被广泛应用后,这些偏见与刻板印象可能会反映在画作中,当大量传播后,可能会衍生出种族与性别歧视问题。


   事实上,供AI训练之用的图片库,数据主要从互联网大量搜集得来,惟内容却未经筛选,难免有偏见风险。更有专家认为,这类AI制图工具很可能会生成未经同意的裸体或逼真人像,因而遭人滥用,散播具骚扰性、助长偏见的假信息。


Getty因版权疑虑下架AI图片


   有鉴于此,OpenAI已为旗下《DALL-E 2》加入内容保护机制,包括:用户不能根据人名来生成人像;不能输入涉及仇恨、骚扰、暴力、自残、裸露、非法活动等主题的文字描述;又会过滤性、暴力、政局、疾病、以至假新闻的相关图片。


OpenAI表示,为防止《DALL-E 2》制图技术被滥用,已加入内容安全机制,让AI既不能产生真实人物脸孔,也不能生成含有暴力、成人或政治等内容的图片。(图片来源:OpenAI官网)


   除此以外,AI在图像训练过程中,也存有盗用他人版权的疑虑。现时AI生成作品的版权在法律上仍未有明确界定,惟大部分AI制图工具的数据库均采用“Creative Commons Zero”(CC0)机制,即是作品的创作者与持有人不会拥有作品的知识产权,而作品则会成为公有财产,代表着任何人都可使用该作品作私人或商业用途。正如其官网表述,《Midjourney》是一个开放社群,容许他人公开发布、使用、重组图像。


   可是,有不少内容与图片网站却认为,AI图片仍有版权问题尚未解决,所以决定要划清界线。早于2021年,美国娱乐内容网站Newgrounds已率先禁止用户提交AI图片。2022年9月5日,网上艺术社群Fur Affinity宣布,因AI作品缺乏艺术价值,故此不准用户分享AI生成图。


   2022年9月21日,大型图库网站Getty Images宣布,平台停止接受AI生成图,以杜绝版权问题;之前已上传到Getty及旗下iStock图库的AI图片也被统统删除。至于另一图库网站Shutterstock,虽然没有高调宣布,但却已静悄悄采取行动;有用户发现,Shutterstock已陆续下架AI生成图,最早时间可追溯至2022年9月19日。


反向搜寻退出训练AI图库


   训练AI需要有大量图片作为学习材料,当中也可能包括他人的艺术作品。因此,数码艺术家夫妇Mat Dryhurst与Holly Herndon架设了一个名为“Have I Been Trained”的搜索引擎,让阁下可以查找自己的画作或照片有否被用作AI训练。


   Have I Been Trained主要基于Laion-5b图片库提供搜寻服务,内里收藏达58亿幅图片,是《Midjourney》和《Stable Diffusion》的AI训练数据基础。一旦阁下发现自己的作品成为AI教材,可以点选搜索引擎的回报系统,表达想将从中退出。


除艺术家外,一般人如想知道自己的个人玉照或宠物相片是否也被当成AI训练教材,也可以利用Have I Been Trained进行搜寻。(图片来源:Have I Been Trained网站)


   目前AI图片生成技术仍处于起步阶段,对作品的版权界定仍非常模糊,对色情、暴力、仇恨内容的限制亦有待改善,惟无可否认的是,数码内容产业的变革经已上路。2022年9月29日,Facebook母公司Meta发表一套名为《Make-A-Video》的AI生成影片系统,只要输入简短字句,便可以自动产生一段5秒的无声短片。


《Make-A-Video》的文字转化影片技术,可以视为文字转化图片技术的増强版本,AI系统能够从静态图像,逆向朝目标字眼来生成短片。(图片来源:翻摄Mark Zuckerberg脸书账户)


   由是观之,AI用文字生成图片或影片的技术趋势,似乎已是无法停下来。可以预期未来会有愈来愈多公司投入资源研发此技术,为艺术与内容创作带来更大便利,但同时也可能会带来种族与性别歧视、侵犯版权、虚假信息泛滥等社会问题。因此,这类AI工具到底是造福社会、还是为祸人间,依然有待观察。

分享:
返回智城物语
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  只看作者评论  查看全部评论:↑顺序 ↓倒序
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序 ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目