输入文字即变超美图！AI制图工具让人人都可以变画家-智城物语-经济通中国站

您现在所在的位置：首页 > 香港脉搏 > 理财／管理 > 智城物语 > 输入文字即变超美图！AI制图工具让人人都可以变画家

理财／管理智城物语

打印本文章

字体:小中大

输入文字即变超美图！AI制图工具让人人都可以变画家

作者：方展策

评论：1

点击率：41046

发表时间: 2022-10-17 12:02:56

作者介绍

少年时，曾研习 Geographic Information System，可惜学无所成，侥幸毕业。成年后，误打误撞进入传媒圈子，先后在印刷、电子、网络媒体打滚，略有小成。中年后，修毕信息科技硕士，眼界渐扩，决意投身初创企业，窥探不同科技领域。近年，积极钻研数据分析与数码策略，又涉足 Location Intelligence 开发项目；有时还会抽空执教鞭，既可向他人分享所学，亦可鞭策自己保持终身学习。

AI机械人的诞生，原意是代替人类执行单调而重复性高的任务，让人们可以专注于讲求创作力的工作。但如果AI已具备创作能力的话，那么人类又应如何自处？早前，有人利用AI作画工具《Midjourney》，赢得美国科罗拉多博览会的艺术奖项，引发网民激烈辩论：AI演算出来的作品算是艺术创作吗？艺术工作者会否被AI淘汰呢？更有论者指，AI制图便利背后，隐藏着种族与性别歧视、以及侵犯版权等严重问题。

AI算法将文字转化图片

2022年８月底，毕业于科罗拉多理工大学计算器科学系、几乎没有美术根底的桌上游戏公司老板杰森·艾伦（Jason M. Allen），凭着画作《太空歌剧院》（Théâtre D'opéra Spatial），在美国科罗拉多博览会（Colorado State Fair）年度艺术比赛的“数码艺术”组别中，夺得冠军殊荣。

桌游公司老板杰森·艾伦提交3幅由《MidJourney》生成的画作，参加科罗拉多博览会的年度艺术比赛，结果其中一幅作品《Théâtre D'opéra Spatial》赢得“数码艺术”组别冠军（图片来源：维基百科）。

这幅带有古典巴洛克风格与科幻电影超现实氛围的作品，画中人物身处黑暗的室内，站在一个圆形巨窗前，凝望着光芒四射的窗外景观，似乎若有所思。表面看来，画作的人物构图、光影表现、以至色彩运用俱佳，能获奖理应毫不奇怪。然而，最大问题是这幅画作不是艾伦本人亲自绘画，而是透过《MidJourney》的AI算法生成。

《Midjourney》是一款AI图像产生工具，能将用户输入的文字转化为图片（Text-to-image）。用户只要输入想象中图片的文字描述和关键词，AI便会尝试分析和理解输入文字，跟着以最适合这段描述的绘画风格生成4幅图片以供选择，整个过程大概只需1分钟左右。

在Midjourney网站上可以看到其他用户透过AI演算出来的最新画作，当中不乏超逼真、超细致的作品。（图片来源：翻摄Midjourney官网）

AI作品摘艺术赛冠军惹争议

艾伦表示，参赛时已清楚注明创作工具为《Midjourney》，并强调自己花了逾80个小时，输入900多个不同的关键词组合，针对画面明暗和用色的文字描述进行多番修正，再从中挑出3张合用的图片。

接着，艾伦使用《Photoshop》微调与润饰这3张图片，譬如AI漏画了其中一个画中人物的头部，需由他后制补上长着深色卷发的头颅；然后，利用《Gigapixel AI》图像处理软件来调高图片解像度；最后，他把编修好的图像档案拿到印刷店印制在画布上，成为参赛作品。

这次比赛的其中一位评审艺术家卡尔杜兰（Cal Duran）表示，艾伦的作品介绍中确实有提及《Midjourney》，但当时他不知晓这是什么，也不知道画作是由AI生成。但卡尔杜兰却认为，这幅画是“讲述故事、唤醒灵魂”的好作品，因此他与另一位评审都认为，它是实至名归的冠军作品。

此奖项公布后，在艺术界引起极大争议。不少人质疑，艾伦将AI生成的画作署名为自己作品的合法性，以及容许AI作品入围是否会构成不公平竞赛。也有人批评，藉由无感情的数据演算进行创作，不符合艺术本质，故此不应把AI生成图当作艺术品，否则艺术便会死亡。但科罗拉多州博览会发言人已表示，不会褫夺艾伦的冠军资格。

笔者输入“punk raiding cat”的文字描述，随即看到根据文字而生成的4张缩图逐步渲染；大概1分钟后，4张缩图就生成完毕。（图片来源：Midjourney AI工具）

笔者从4张缩图中选取较满意的再进行放大细节化，最终得出这幅带点“Punk”味的长耳大眼白猫肖像图。（图片来源：Midjourney AI工具）

美编、插画师可能工作不保

有支持者认为，数码艺术作品本来就要藉助数码工具来完成，《Midjourney》等AI制图工具跟常用的《Photoshop》并无太差异；而且用AI创作仍是基于人类的创造力和想象力，要求操作者在有限字词内精准表达画作的主题、光影与构图，就创作本质来说没什么不同，只是从用画笔绘画，变成以键盘作画而已。

更有论者认为，艺术工作者透过AI工具可以快速地将脑中想法化为图像，从中提取设计元素绘画成新作品，有助缩短构思时间，提高创作效率。此外，计算机游戏公司也可以使用这类工具来生成游戏场景与角色，加快开发进程。

不过有些人担忧，若果连艺术创作都可以由AI代劳，那么未来人类是否可以完全被智能机械人取代呢？漫画家马特·波莫（Matt Borrs）表示，对插画家而言，AI作画非常让人沮丧，因为这预告着插画师即将要失业了。

譬如财经杂志《经济学人》（Economist）在2022年6月以“AI新境界”（AI’s New Frontier）作为封面故事，并首度采用《Midjourney》来制作封面图片。据悉，已有部分外国出版社开始使用AI生成图片，供编辑挑选作内文配相。假如日后AI作画工具被大规模引入到出版界，或许会构成美术编辑、插画师出现人手过剩的问题。

《经济学人》编辑团队在《Midjourney》上经过250次的文字输入尝试，生成了1,000张缩图，再从中挑选出一张制成2022年6月出版的杂志封面图片。（图片来源：Economist官网）

大数据图像训练含偏见风险

目前市场上的AI制图工具除《Midjourney》外，还有OpenAI的《DALL-E 2》、Google Research的《Imagen》、以及StabilityAI的《Stable Diffusion》，都是只需靠着文字输入，就可以生成各式各样的图像。

这类工具的运作原理是，AI透过网上图片库内的大量风景、对象、人物照片来进行比对和训练，跟着从中挑选出特定主题和样式，组成不同模板，然后使用这些模板来生成用户输入的图像内容。

可是，这种大数据图像训练却有机会让AI大量复制数据内的西方文化与性别刻板印象，以致AI生成的图片大都隐含着某些偏见与刻板印象。譬如说，输入“Nurse”一词，AI产生的图像大都是戴着听诊器的女生；输入“CEO”一词，生成的图像几乎全部是白人男性。

Google的研究报告指出，AI作画工具倾向生成肤色较浅人种的图像，同时对不同职业的描绘亦容易产生特定性别的刻板形象。日后当AI工具被广泛应用后，这些偏见与刻板印象可能会反映在画作中，当大量传播后，可能会衍生出种族与性别歧视问题。

事实上，供AI训练之用的图片库，数据主要从互联网大量搜集得来，惟内容却未经筛选，难免有偏见风险。更有专家认为，这类AI制图工具很可能会生成未经同意的裸体或逼真人像，因而遭人滥用，散播具骚扰性、助长偏见的假信息。

Getty因版权疑虑下架AI图片

有鉴于此，OpenAI已为旗下《DALL-E 2》加入内容保护机制，包括：用户不能根据人名来生成人像；不能输入涉及仇恨、骚扰、暴力、自残、裸露、非法活动等主题的文字描述；又会过滤性、暴力、政局、疾病、以至假新闻的相关图片。

OpenAI表示，为防止《DALL-E 2》制图技术被滥用，已加入内容安全机制，让AI既不能产生真实人物脸孔，也不能生成含有暴力、成人或政治等内容的图片。（图片来源：OpenAI官网）

除此以外，AI在图像训练过程中，也存有盗用他人版权的疑虑。现时AI生成作品的版权在法律上仍未有明确界定，惟大部分AI制图工具的数据库均采用“Creative Commons Zero”（CC0）机制，即是作品的创作者与持有人不会拥有作品的知识产权，而作品则会成为公有财产，代表着任何人都可使用该作品作私人或商业用途。正如其官网表述，《Midjourney》是一个开放社群，容许他人公开发布、使用、重组图像。

可是，有不少内容与图片网站却认为，AI图片仍有版权问题尚未解决，所以决定要划清界线。早于2021年，美国娱乐内容网站Newgrounds已率先禁止用户提交AI图片。2022年9月5日，网上艺术社群Fur Affinity宣布，因AI作品缺乏艺术价值，故此不准用户分享AI生成图。

2022年9月21日，大型图库网站Getty Images宣布，平台停止接受AI生成图，以杜绝版权问题；之前已上传到Getty及旗下iStock图库的AI图片也被统统删除。至于另一图库网站Shutterstock，虽然没有高调宣布，但却已静悄悄采取行动；有用户发现，Shutterstock已陆续下架AI生成图，最早时间可追溯至2022年9月19日。

反向搜寻退出训练AI图库

训练AI需要有大量图片作为学习材料，当中也可能包括他人的艺术作品。因此，数码艺术家夫妇Mat Dryhurst与Holly Herndon架设了一个名为“Have I Been Trained”的搜索引擎，让阁下可以查找自己的画作或照片有否被用作AI训练。

Have I Been Trained主要基于Laion-5b图片库提供搜寻服务，内里收藏达58亿幅图片，是《Midjourney》和《Stable Diffusion》的AI训练数据基础。一旦阁下发现自己的作品成为AI教材，可以点选搜索引擎的回报系统，表达想将从中退出。

除艺术家外，一般人如想知道自己的个人玉照或宠物相片是否也被当成AI训练教材，也可以利用Have I Been Trained进行搜寻。（图片来源：Have I Been Trained网站）

目前AI图片生成技术仍处于起步阶段，对作品的版权界定仍非常模糊，对色情、暴力、仇恨内容的限制亦有待改善，惟无可否认的是，数码内容产业的变革经已上路。2022年9月29日，Facebook母公司Meta发表一套名为《Make-A-Video》的AI生成影片系统，只要输入简短字句，便可以自动产生一段5秒的无声短片。