香港脉搏www.etnetchina.com.cn
 理财/管理智城物语
打印logo打印本文章电邮logo字体:
分享:
OpenAI狂推AI生成工具,掀起人工智能创投浪潮!
方展策
作者:方展策评论评论:点击率点击率:

发表时间: 2022-12-26 15:03:45

作者介绍

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

   《Science》杂志刚刚发表2022年度科学十大突破,除众望所归的韦伯太空望远镜外,近期大热的“AI生成内容”(AIGC)技术亦榜上有名。随着AI制图工具、智能聊天机械人先后爆红,AIGC现已成为创投界的新焦点;当中最被看好的玩家,正是凭ChatGPT一战成名的OpenAI,预计未来两年内可创造10亿美元收入。究竟OpenAI是如何崛起?它对人工智能发展有什么影响?如此有前景的AI研究实验室,为什么其共同创办人、科技狂人马斯克要中途退出呢?


OpenAI宣称开放AI研究成果


   2015年,Tesla执行长埃隆·马斯克(Elon Musk)、创投公司Y Combinator前总裁萨姆·阿尔特曼(Sam Altman),与多位企业家和学者携手成立非牟利AI研究组织OpenAI。初始资金是来自马斯克与PayPal创办人彼得·泰尔(Peter Thiel)共同投资的10亿美元(约7.8亿港元)。


OpenAI希望发展出能为人类创造贡献的友好AI,并会公开分享其AI研究成果。(图片来源:OpenAI官网)


   该组织旨在研发出能造福全人类的通用型人工智能(Artificial General Intelligence,AGI),并会对外分享其研究成果。所谓“AGI”,意指拥有接近、甚或超越人类智力的人工智能,具备有如人类的认知能力与逻辑推理力,甚至有自我意识,能够执行不同任务,适用于广泛用途。


   目前常见的AI则属于应用型人工智能(Applied AI),只可执行有明确目标的任务,仅限于特定用途,例如自动导航、人脸辨识、医疗影像判读等。由此可见,OpenAI创立之初已树立了AI领域的最高标竿。


   2017年,OpenAI开发出电竞AI“OpenAI Five”,尝试与人类电竞选手1对1决战,顺利夺得首胜。2018年,OpenAI Five正式推出,能够同时控制5个游戏角色,组成一支完整队伍,于是开始接受全球玩家挑战,最终创下99.4%的获胜率。


2019年4月,OpenAI旗下电竞人工智能OpenAI Five,击败《Dota 2》国际邀请赛的冠军队伍,成为全球首个在电竞比赛中击败人类世界冠军的AI。(图片来源:OpenAI官网)


马斯克与OpenAI团队有分歧


   可是,在OpenAI刚做出一点成绩之际,马斯克却决意退出。2019年2月,马斯克宣布离开OpenAI,因为要专注于Tesla与SpaceX的业务,而且Tesla与OpenAI都要大量招聘AI人才,存有潜在利益冲突。他亦坦承,跟OpenAI团队有意见分歧,惟未透露具体的分歧事由。


   马斯克出走后一个月,OpenAI于2019年3月宣布成立营利公司OpenAI LP,转向商业化,并开始向微软(Microsoft)靠拢,这很有可能是马斯克所指的“分歧”。同年7月,微软向OpenAI投资10亿美元(约7.8亿港元),双方共同开发Azure AI超级运算技术,而OpenAI所有服务亦会迁移到Azure云端平台运作。


   2020年,微软宣布获得OpenAI自然语言模型GPT-3的独家授权,可为客户提供人工智能解决方案。这可说是OpenAI迈向商业化的关键一步,惟却被外界质疑有违其开放技术的承诺。


OpenAI表示,GPT-3自2020年推出以来已被套用于300多个应用软件,每天生成逾45亿个字。(图片来源:OpenAI官网)


微软获GPT-3独家授权惹争议


   虽然微软技术长凯文·史考特(Kevin Scott)强调,该公司只是取得GPT-3底层程序码的使用权,外界仍可通过OpenAI的API使用GPT-3模型,但一众网民却不买帐。马斯克也在Twitter留言批评,此做法跟组织本身的“开放”理念背道而驰,更直言:“OpenAI已被微软俘虏了”。


身为OpenAI共同创办人的马斯克认为,把GPT-3独家授权给微软,违背了OpenAI的“开放”初衷。(图片来源:Twitter@elonmusk账户)


   2021年,OpenAI在微软和其他合作伙伴的资金支持下,推出OpenAI 初创基金,提供1亿美元(约7.8亿港元)的资金池,用于帮助对世界产生深远和积极影响的AI初创公司。被选中的初创可提前进入未来的OpenAI 系统,并获得OpenAI 团队的技术支援。


   开发AI系统所需的人手与资源均非常庞大,但当时针对AI初创的企业孵化器却不多,故此OpenAI无疑是希望透过这个初创基金,抢先找出并扶植有潜力的AI初创,以掌握AI技术的发展先机,并增强其在人工智能领域的影响力。


AI生成音乐、图像、文字、程序


   除藉助微软来扩张势力外,OpenAI也陆续开发出不同的AIGC服务,并公开部分成果给网民使用。2019年诞生的MuseNet,能够基于用户上传的乐曲,为其添加乐器,并注入不同的演奏风格,生成新的音乐作品。


MuseNet可让用户选择多种不同的乐器(如钢琴、吉他、鼓等)和音乐风格(如爵士乐、Lady Gaga、莫札特等),自动生成约4分钟长度的音乐。(图片来源:OpenAI官网)


   2020年释出的Jukebox,用户无需上传音乐,只需输入歌手、歌词和曲风等资料,系统便能自动产出接近CD音质的乐曲。


Jukebox使用了120万首歌曲(其中60万首是英语歌曲)来做训练 ,并依照这些歌曲的音乐性质做分类。用户只要输入歌手、歌词和曲风等设定参数,AI便会自动生成特定风格的音乐作品。(图片来源:OpenAI官网)


   2021年面世的Codex,能够将用户输入的文字描述,转换为程序码;换言之,开发者可以用简单的口语指令来编写程序,不同再学习繁复的编程语法。同年,OpenAI一口气发布两项更瞩目的新产品,分别是输入文字即能生成图像的DALL-E,以及上传图片后即能产生文字的CLIP。


Codex是一个能够将自然语言转换成为程序码的人工智能,换句话说,用户只要输入一般英语,AI便会自动转译成程序码。(图片来源:OpenAI官网)


   2022年4月,OpenAI释出DALL-E的后继版本DALL-E 2,并开放给公众付费使用;伴随着其他AI产图工具如Midjourney与Stable Diffusion等相继投入服务,令同年年中社交媒体上涌现一波AI绘图热潮。


DALL-E 2是一个AI制图工具,用户输入叙述文字后,即能产生相应的图片,还可以对图片进行编辑。(图片来源:OpenAI官网)


   2022年11月,OpenAI推出智能聊天机械人ChatGPT,凭借其超卓的问题解答与撰写文案能力,在短短一个星期内吸引逾100万人涌入试玩,不仅将AIGC热潮推上另一高峰,更使OpenAI的名字变得广为人知。


ChatGPT是一个AI聊天机械人程序,由GPT-3延伸出来的GPT-3.5模型所驱动,能够分析和理解输入文字的含义,并判断上下文来生成相应、连贯的回应。(图片来源:OpenAI官网)


ChatGPT爆红创造吸资良机


   鉴于经济前景不明朗,2022年初有部分创投公司已放弃投资OpenAI。目前该公司估值约为200亿美元(约1,560亿港元),惟有些投资者却怀疑,它是否配得上如此高估值,日后又是否真的有能力跟Google搜寻引擎竞争。这次ChatGPT爆红,可说是OpenAI挽回创投界信心,争取更多外部投资的大好机会。


   至于其最大靠山Microsoft,似乎一直对OpenAI充满信心。有消息人士透露,该公司已寻求增持OpenAI股权。微软希望能藉着OpenAI的自然语言处理技术,助其拓展云端业务。现时微软已把GPT-3模型整合至其云端平台,推出Azure OpenAI服务。


   微软现已在 Microsoft Power Apps中使用GPT-3模型,透过将文字描述转换为编程指令,协助没有编程背景的人开发应用程序。稍后推出的Microsoft Designer绘图工具,背后是由DALL-E 2驱动,当用户输入文字后,即可获得想要的平面设计素材,如Facebook贴文图片、PowerPoint简报、或横幅广告图片等。


微软宣布在Microsoft 365服务中将新增名为“Microsoft Designer”的AI制图工具,基于OpenAI旗下DALL∙E 2提供服务,可让用户能透过文字描述方式,快速创作图像内容。(图片来源:Microsoft官网)


与Shutterstock合作卖AI图片


   不过,OpenAI要赢得大部分投资者的信心,始终要具备创造长期收入的能力。现时AI产图工具DALL-E 2生成一张1024×1024像素的图片,会向使用者收取0.02美元的服务费;至于OpenAI的文本生成服务,则每750字收取0.02美元(约0.16港元)的生成费用。


   此外,OpenAI亦有与其他初创公司合作,共同创造营收。譬如,二手车网上平台CarMax利用OpenAI技术,为平台上的二手车建立文字摘要,并整理车主评论,方便用户浏览;AIGC服务供应商Jasper则透过OpenAI技术,为客户生成各式各样的营销内容,包括社交媒体贴文、博客文章、广告文案、或电子邮件等。


   OpenAI又会跟商业图库平台Shutterstock合作贩售AI生成图片。Shutterstock表示,在未来几个月内会在平台上推出AI图像生成服务,并会设立补偿基金,为图片曾被用于训练AI模型、以及作品曾被用作合成图片的艺术家提供补偿。


   OpenAI公司内部估计,2023年营收有望达2亿美元(约15.6亿美港元),2024年更有机会攀升至10亿美元(约78亿港元)。


Google抢进投资AIGC初创


   除OpenAI外,另一热衷于AIGC的科技巨擘正是Google。2022年5月,Google发表可以将文字转图片的AI生成系统Imagen,背后使用的自然语言模型是由Google Research所研发的 Transformer。


   另外,Google亦有研发类似ChatGPT的智能聊天系统LaMDA,并已跟Google搜寻、Google图书、Google地图、YouTube等串连起来,尽吸Google旗下服务庞大的数据与知识,已能展现出接近真人对话的能力。


   最近更有消息传出,Google正跟开发自然语言处理软件的AI初创Cohere进行洽谈,有意投资至少2亿美元(约15.6亿港元)。观乎OpenAI与Google近期积极投资于AI初创的行动,预计AIGC将会成为科技巨头技术竞赛的新战线。


AIGC变成创投资金追捧对象


   自加密货币市场崩盘后,创投界对Web 3.0的投资兴趣已大幅减弱,并逐渐转向AIGC领域。AI绘图初创Runway于2022年12月初成功募资5,000万美元(约3.9亿港元),其共同创办人克里斯托瓦尔·巴伦苏埃拉(Cristóbal Valenzuela)表示,4 年前创业时,投资者都不看好生成式AI,但现在却有投资者告诉他,这项技术可能会像20年前的智能手机般具有变革性。


AI绘图初创Runway共同创办人巴伦苏埃拉表示,现时AIGC技术备受创投界关注。该公司刚于2022年12月5日完成5,000万美元C轮融资。(图片来源:Runway官网)


   红杉资本(Sequoia Capital)认为,除艺术、文字、广告创作外,程序编写、游戏开发、建筑设计、甚至法律草拟等工作,也有可能由 AI 代劳,因此生成式AI技术有望颠覆所有讲求创造力的行业,并拥有数兆美元的经济价值。


   私募市场数据平台PitchBook的资料显示,纵使整体创投投资规模缩减,但生成式AI的创投投资总额自2020年以来却暴涨了425%,到2022年更增加到21亿美元(约163.8亿港元),可见AIGC现已变成创投资金的追捧对象了。


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。

分享:
返回智城物语
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  只看作者评论  查看全部评论:↑顺序 ↓倒序
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序 ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目