香港脉搏www.etnetchina.com.cn
 理财/管理智城物语
打印logo打印本文章电邮logo字体:
分享:
AI的战国时代:亚马逊剑指OpenAI,马斯克对撼ChatGPT
方展策
作者:方展策评论评论:点击率点击率:

发表时间: 2023-04-24 14:24:13

作者介绍

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

   当Google跟微软、OpenAI在AI领域斗得天昏地暗之际,亚马逊终于按捺不住,正式宣告加入AI战团,但不是发表像ChatGPT般的AI应用,而是推出AI开发云端平台和大型语言模型,方便企业客户制作自家AI软件。另一边厢,不断公开反对OpenAI的科技狂人马斯克,正在筹组新AI公司“X.AI”,更会开发名为“TruthGPT”的聊天机器人,看似有意跟OpenAI和ChatGPT一决雌雄。随着亚马逊、马斯克相继入局,会对生成式AI市场带来什么冲击呢?


Bedrock平台式服务简化AI开发


   2023年4月13日,亚马逊(Amazon)旗下全球最大云端服务供货商AWS宣布,针对企业客户推出AI平台式开发服务“Bedrock”和自家基础模型“Titan”,让开发团队能以较简单而低成本的方式,部署生成式AI应用。


AWS发表Bedrock开发平台和Titan基础模型,帮助企业客户简易地开发出聊天机器人或文生图的服务。(图片来源:Amazon官网)


   AWS表示,客户可视乎其开发取向而选择合适的基础模型,跟着用自家公司数据训练出专属的AI模型,然后透过AWS工具把模型整合到自有AI应用。至于AI市场龙头OpenAI,亦有提供类似服务,容许企业客户因应业务需要而微调模型。


   在Bedrock平台上,客户可通过API使用4个不同的基础模型:由前OpenAI员工成立的美国AI初创Anthropic,旗下“Claude”模型可执行多种对话和文本处理任务,宣称是诚实且负责任的AI系统。来自以色列初创AI21 Labs的“Jurassic-2”,能够生成多国语言文案,包括:法语、德语、意大利语、荷兰语、西班牙语、以及葡萄牙语。来自英国初创Stability AI的“Stable Diffusion”,能够产制高质图像、商标和其他设计图等。


OpenAI前研究副总裁达里奥•阿莫迪(Dario Amodei)因公司发展方向与其他同事有意见分歧,于是决定自立门户,2021年创办Anthropic,旗下主打产品“Claude”已被AWS纳入为Bedrock平台上可供选择的基础模型之一。(图片来源:Anthropic官网)


以色列AI初创AI21 Labs于2022年取得6,400万美元(约4.99亿港元)融资,并于2023年1月推出一款AI写作工具,其背后模型也被纳入Bedrock平台。(图片来源:AI21 Labs官网)


英国AI初创Stability AI的估值高达40亿美元(约312亿港元),主要产品为“Stable Diffusion”图像生成器,其AI模型亦已加入Bedrock基础模型行列。(图片来源:Stability AI官网)


   至于亚马逊自家的“Titan”,内含两个大型语言模型,分别提供两项功能:“文本生成”,适用于研发开放式问答、以及生成文案服务等;“文本嵌入”,可以将文字输入转换成包含语义的数值,适用于开发个人化服务、推荐、以及搜寻等。


客户数据绝不用于AWS模型训练


   Bedrock客户不用自建服务器,便可以直接基于Titan或其他模型来创建AI应用,有助减省整体开发成本。AWS承诺,客户输入至Titan的数据,只会留在自家平台上,而不会充当Titan的训练数据,避免公司机密外泄。此外,Titan可以侦测和移除数据中的有害内容,又可以拒绝用户输入不当或低俗内容,更可以过滤模型本身产出的仇恨言论、色情和暴力内容等。


   亚马逊新任执行长的安迪·贾西(Andy Jassy)在写给股东的信中,强调该公司现正积极投资大型语言模型和生成式AI技术,预期这项投资足以让Amazon往后几十年在各个业务领域均可进行创新。


   尽管亚马逊不像Google和Microsoft般,能够搭配搜索引擎和字处理软件来推展AI应用,但该公司作为电商和云端服务龙头,不仅掌握巨量的网购数据,在云端运算方面也有很强的竞争力,故此AWS在这场AI竞赛中仍是非常强劲的对手。


Twitter购1万枚GPU供AI运算


   不过,或许有一个更强的挑战者即将登场——身兼特斯拉(Tesla)、SpaceX与Twitter执行长的埃隆·马斯克(Elon Musk),也有意投入生成式AI开发。网媒《Business Insider》报道指,Twitter已向辉达(NVIDIA)采购约10,000枚图像处理器(GPU)供AI运算之用。据闻,Open AI为训练GPT-4模型,花费了1亿美元(约7.8亿港元)购入10,000枚NVIDIA A100图像处理器。


有报道指,Twitter已向NVIDIA购入10,000枚GPU,暂时还不清楚采购了哪个型号,但外界估计有可能是NVIDIA A100的后继产品“H100”,在相同功率下指令周期能比上代快上好几倍。(图片来源:NVIDIA官网)


   除此以外,Twitter也在招聘新的AI工程师。较早前,该公司从Google母公司Alphabet旗下AI实验室DeepMind挖走科学家巴布斯金(Igor Babuschkin),主掌新AI项目发展。外界预期,Twitter将利用自家社群平台上的数据来训练模型,惟其发展AI的真正意图尚未明朗,既有可能是改善Twitter搜寻功能,又有可能是帮助客户生成广告内容,以提振广告业务。


马斯克从2023年2月以来一直找寻AI人才,近日成功从DeepMind挖走科学家Igor Babuschkin与6名工程师,加入其AI开发团队。图中为DeepMind伦敦总部。(图片来源:维基百科)


   更叫人吃惊的是,作为OpenAI前创办人之一的马斯克有意另起炉灶,创立一家全新AI公司直接与OpenAI竞争;他已开始向特斯拉和SpaceX的投资者寻求更多资金,用作启动新公司。


马斯克新公司X.AI挑战OpenAI


   根据内华达州的企业记录,一家名为X.AI的新公司已于2023年3月9日注册成立,马斯克是公司唯一董事,负责营运马斯克家族办公室Excession的贾里德·伯查尔(Jared Birchall)则出任新公司秘书。马斯克早前已将Twitter并入其私人公司X Corp.,现今再加上X.AI,似乎与传闻中他欲创建万能App(Everything App)“X”的愿景一脉相承。


Twitter公司现已被合并到X Corp.,马斯克直言他的最终目标是创建万能App“X”,并重申Twitter是实现此目标的催化剂。未知这个App日后跟X.AI公司与Twitter将会产生什么化学作用呢?(图片来源:维基百科)


   2023年4月17日,马斯克接受《福克斯新闻》(Fox News)专访时首度承认,将会开发一个名为“TruthGPT”的AI聊天机器人。马斯克形容,TruthGPT是致力于追求真相、试图理解宇宙本质的AI。他认为,人类是宇宙中有趣的一部分,而一个了解宇宙的AI不太可能消灭人类,所以它会是一个安全的AI。


   此外,马斯克又狠批,OpenAI已从非牟利组织变成只顾图利的企业,不再开放原始码,并跟微软(Microsoft)的商业关系过于紧密。事实上,马斯克一直公开反对他有份创办的OpenAI,早前更带头签署公开信,呼吁全球AI实验室暂停训练比GPT-4更强大的模型起码6个月,被视为针对OpenAI的举措。如今马斯克扬言要开发TruthGPT,更被外界认为这是向ChatGPT宣战的新动作。


马斯克一边呼吁暂停生成式AI开发,一边却创办X.AI公司,进入生成式AI市场。究竟这是出于炒作,还是因为当初错失OpenAI而现在心有不甘呢?(图片来源:Twitter@elonmusk账户)


OpenAI拟落户日本拓亚洲业务


   面临愈来愈多挑战者涌现,OpenAI亦不敢怠慢,力求拓展业务版图。该公司执行长山姆·阿尔特曼(Sam Altman)于2023年4月10日亲赴日本,跟首相岸田文雄会面。他表示,看好ChatGPT在日本的发展前景,希望在当地开设办公室,建立适合日本民众、文化和语言的AI模型。


   日本内阁官房长官松野博一表示,首相岸田文雄已就AI技术的优点,以及可能带来的私隐、侵权等风险,与奥特曼交换意见;日本政府在衡量优点和风险后,将会评估引入OpenAI技术的可能性。


   另一方面,奥特曼认为,未来推动AI科技进步需要有新的思路,不能只靠扩大AI模型和提供更多训练数据的单一做法。OpenAI在GPT-4技术论文中指出,扩大模型规模的投资回报正在递减,这是因为可以建设的数据中心数目、以及兴建这些中心的速度,均存在物理限制。


未来AI模型规模重要性或下降


   在麻省理工学院的一场活动上,奥特曼被问到GPT-4的训练成本是否要1亿美元,他的答案是“不止如此。”扩大模型规模,输入更多训练数据,采用更大运算力,可说是OpenAI过去几年推动GPT模型演进的基本套路。不过,或许OpenAI也深感模型规模不能无止境扩大,不宜继续将之视为改进AI的唯一重要因素,所以宣布推出GPT-4时,未有如往昔般披露AI模型规模有多大。


   如不再依赖扩大模型规模来提高性能,那么还有什么其他办法可以增强AI能力呢?除研发新的AI模型设计或架构外,还可以使用“人类反馈强化学习”(Reinforcement Learning from Human Feedback)技术,透过人类的反馈来改进模型性能。


   举例来说,假设有一个机器人正在学习如何在一个迷宫中寻找出口。当机器人走错路时,人类给予负面回馈;当机器人找到出口时,人类则给予正面反馈。通过这些反馈,机器人就可以学习如何更好地执行任务。


OpenAI技术上仍居领先位置


   事实上,一家公司要在这场AI技术竞赛中取得成功,有4项客观条件非常重要:第一是运算能力,这需要巨额资金来采购大量GPU,以往只有大企业才能够负担,但随着像Bedrock般的平台式云端服务出现后,却让投资门槛大幅降低。第二是人才,就像马斯克要启动新AI项目,也要从DeepMind挖角AI人才。


   第三是训练数据,这涉及如何在有效率、不侵权的情况下,取得训练模型所需的大量数据;马斯克扬言要控告微软,理由是对方违法使用Twitter数据来训练其AI模型。第四是用户回馈,让AI模型可基于这些反馈来不断调整和改进,而ChatGPT现有逾1亿用户正在使用,在这点上已握有绝对领先优势。


   由是观之,生成式AI市场将会迈向群雄并起的战国时代,除微软、Google、亚马逊等既有科技巨头外,后起之秀还有X.AI、Anthropic、AI21 Labs、Cohere和Character.AI等。然而,OpenAI现时手握GPT-4模型,预计2023年9月或10月更会释出GPT-4.5,在技术上依然是一骑绝尘,其他对手唯有投入更多资源来建构更强大的算法,以努力追上OpenAI的脚步。


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。

分享:
返回智城物语
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  只看作者评论  查看全部评论:↑顺序 ↓倒序
  • 暂无读者评论!
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序  ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目