香港脉搏www.etnetchina.com.cn
 理财/管理【FOCUS】
打印logo打印本文章电邮logo字体:
分享:
谷歌Gemini惊艳,AI创富聚焦“行动力”
评论评论:点击率点击率:

发表时间 2023-12-07 15:31:56

   当ChatGPT4独领风骚、Sam Altman人设如神、微软股价创下新高……蛰伏多时的谷歌周三(6日)终于以雷霆万钧之势,揭盅下一代AI大模型“王者”--Gemini 1.0。主打“多模态(multimodal)模型”,文字理解功夫了得,更凭借同门Youtube海量视频,练就图片、音频、视讯的跨模态(cross-model)分析、推理神技,预示AI竞赛下一焦点将从“知识力”晋级至“行动力”。


主打“跨模态”,分析、推理、规划


   从Gamil的“帮我写信”,到Google地图的沉浸式街景,再到Google相册的魔法编辑,身为AI先驱的谷歌,自去年11月起就相当憋屈,皆因OpenAI旗下ChatGPT问世抢尽光芒。眼看ChatGPT4上月再下一城推出Turbo版,谷歌5月就预告的Gemini始终只闻楼梯响,直到昨日。


   被谷歌首席执行长Sundar Pichai称为“我们迄今为止最强大、最通用模型”的Gemini,1.0版本分为三种尺寸:用于高度复杂任务的Ultra、用于大规模增强效能的Pro、用于行动装置应用程序的Nano。谷歌指,Gemini Ultra在MMLU(大规模多任务语言理解)基准检验(覆盖57门专业学科)中,以90.0%得分击败GPT4的86.4%,且是首个超越人类专家的大模型。


当输入“提供三个用两种颜色制作钩针作品的主意”,Gemini会规划出创作主意。


   但Gemini最让人惊艳的技能仍是“跨模态”,即同时识别文字、图片、视讯、语音,并进行分析、推理、规划。例如,当展示一段人身体后倾、舞动双臂动作的视频,Gemini会推理为这是模仿电影“Matrix”的子弹时间镜头;当输入“提供三个用两种颜色制作钩针作品的主意”,Gemini会规划出蓝黄耳朵的狗、黄色触手的蓝色水母、黄鼻子的蓝猫。


初创融资方兴未艾,助升全球生产力


   伴随AI大模型的强大进化,通过提问获取精简信息,输入文本获取摘要报告,提交指令撰写简历、创作故事等“知识力”技能比拼,将升级至“行动力”之争。


   早前获亿万富翁、NBA球队班主Mark Cuban垂青的初创公司Bot-it,就利用AI为每个人量身定制音乐会、餐厅、露营、限量运动鞋的自动预定、付款、取消功能。而公司“Automation Made Easy”,正正一语道出AI下半场“行动力”的精要。


AI独角兽Adept的B轮融资斩获3.5亿美元。


   看看4月成立的AI视讯生成工具Pika Labs,短短半年获得融资5500万美元;类似的还有允许用户自定义3D角色、并可用于游戏、电影、电子商务的AI初创公司Character.ai,据报正获谷歌洽谈投资,估值超过50亿美元。此外,被视作OpenAI后继者的Adept AI,旨在为人类建立浏览互联网、使用软件、指示AI工作等“最好的助手”,获得英伟达、微软、SV天使投资等大手投资。


   据普华永道估算,到2030年,AI料可为全球经济贡献15.7万亿美元,其中6.6万亿来自生产力提高,另9.1万亿来自消费端效应。对打工者、创作者、创业者来说,务必仅记:未来取代你的不是AI,而是擅于运用AI的人。

分享:
返回【FOCUS】
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  查看全部评论:↑顺序 ↓倒序
  • 暂无读者评论!
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序  ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目