loading...
发表时间: 2024-04-05 18:08:03
少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。
生成式AI热潮横扫全球,OpenAI、Anthropic等乘势而起,抢占大量市场份额,让AI市场被美国公司完全主导,但此局面或许会被来自法国的Mistral AI所打破。这家成立不到一年、只有25名员工的AI初创,已推出能跟OpenAI匹敌的AI产品,并先后获得英伟达(NVIDIA)、微软(Microsoft)的注资,因而受到市场高度关注。究竟Mistral AI有何过人之处,可以让它在短时间内跃居为欧洲最热门的AI公司、甚至是OpenAI的最强挑战者呢?
7页简报换来1.13亿美元投资
2023年5月,Mistral AI正式注册成立,3位联合创办人亚瑟·门施(Arthur Mensch)、蒂莫西·拉克鲁瓦(Timothée Lacroix)、以及纪尧姆·兰普尔(Guillaume Lample)从学生时代已认识。门施曾担任Google DeepMind部门的研究员,是大型语言模型Chinchilla与视觉语言模型Flamingo的骨干开发成员。拉克鲁瓦、兰普尔曾在Facebook母公司Meta的巴黎AI实验室工作,是开源模型Llama与Llama 2的核心贡献者。
该公司成立一个月后,只有6名员工,还未造出任何产品,但却凭着7页Powerpoint简报,成功取得1.13亿美元(约8.81亿港元)的投资,是欧洲有史以来最大笔的种子轮融资,令公司估值达到2.6亿美元(约20.28亿港元),震动整个欧洲AI业界。
2023年9月,Mistral AI发布第一个AI模型“Mistral 7B”,所有基准测试中表现均优于Meta Llama 2;同年12月推出第二个模型“Mixtral 8x7B”,能够处理32K token(相等于2.5个英文单字)上下文,大多数基准测试表现胜过OpenAI GPT-3.5。
先后获NVIDIA、微软策略投资
凭著如此亮丽的产品成绩,Mistral AI于2023年12月完成4.15亿美元(约32.37亿港元)的A轮融资,让公司估值暴增至20亿美元(约156亿港元),跻身为欧洲独角兽之一。这次由著名创投公司Andreessen Horowitz(a16z)领投,吸引了NVIDIA参与投资,并成为Mistral AI的策略合作伙伴,这让该公司有管道取得英伟达的最新技术。
2024年2月,Mistral AI释出全新大型语言模型“Mistral Large”、以及类似ChatGPT的聊天机械人“Le Chat”。在多项基准测试中,Mistral Large的成绩优于Google Gemini Pro、Anthropic Claude 2和Meta Llama 2,仅逊于GPT-4,。
Mistral AI的聊天机械人“Le Chat”现仍处于测试阶段,大家只要前往chat.mistral.ai注册新帐户,即可免费试用。(图片来源:翻摄Mistral AI官网)
同月,微软宣布与Mistral AI达成合作伙伴关系。据悉,微软不但向Mistral AI投入1,500万欧元(约1.27亿港元)的资金,还会向其Azure云端平台客户提供Mistral Large的服务选项。近日更有消息指,日本软银集团有意参与Mistral AI下一轮融资,可能让其估值突破20亿美元。
模型完全开源,使用修改无限制
为什么Mistral AI被那么多人看好?尽管其商业模式跟OpenAI非常相似,同样是通过API来提供大型语言模型,然后按照使用量向客户收费,但它与OpenAI的最大分野是,坚持走“开放源码”(Open Source)路线。在开源授权模式下,Mistral模型内部结构是公开的,任何人都可以修改;开发者可根据业务需要来调整模型大小,藉此控制成本或适应特定任务。
Mistral Large采用“Mixture of Experts”(MoE)架构,模型表现直逼GPT-4,因此被喻为是OpenAI的最强挑战者。(图片来源:Mistral AI官网)
Mistral AI商业长弗洛里安·布雷桑(Florian Bressand)指出,对国营或受严格管制的机构来说,开源AI模型特别有吸引力。譬如说,国防企业或银行有意采用生成式AI,但因条例规限而不能使用闭源的专有软件(Proprietary Software),这时候开源模型就是唯一选择。
目前市场上最出名的开源模型是Meta Llama 2,但它会根据用户规模和使用目的而施加相应限制,例如月均活跃用户在7亿以上便要向Meta申请特殊授权。至于Mistral模型,对用户的使用、复制、修改程式码均没有任何限制。
目前有十多家企业采用Mistral模型,客户来自全球各地,当中包括法国巴黎银行。据悉,Mistral AI平台的使用量约有5成来自美国。(图片来源:维基百科)
Mistral模型变小,训练成本低
更重要的是,Mistral AI非常擅于整理和筛选用于训练模型的数据,能够过滤当中重复或无意义的杂讯,因此可用较少数据来训练AI模型,让其模型训练成本远低于GPT-4的1亿美元(约7.8亿港元)。同时,因为训练数据量较少,模型规模也变小了,所以客户可以直接在自己的电脑上运行Mistral模型,不需再花大钱租用云端数据中心。
在地缘政治局势日趋紧张下,愈来愈多国家认为本土研发的大型语言模型可以带来经济和战略上的优势;尤其是欧洲企业,不愿被单一美国AI平台绑定,可能有较高意愿支付Mistral模型的使用费。
继Meta 与Google后,开源阵营再添一名新力军Mistral AI,令AI开源声势看似大振。惟真正决胜关键在于,OpenAI在2024年夏季发布新一代大型语言模型“GPT-5”的实际表现如何。倘若它的效能较上代有飞跃改进,甚至完全辗压Mistral Large、Meta Llama、Google Gemma等开源模型,那么OpenAI一家独大的局面很有可能会持续下去。
《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。
(点击用户名可以查看该用户所有评论) 只看作者评论 查看全部评论:↑顺序 ↓倒序 |