Features每日专题
专题

开源模型再现黑马,仅用“数千个”H800训练

评论评论:点击率点击率:2025-02-19 14:30:26
打印logo打印本文章电邮logo字体:
分享:

   DeepSeek横空出世,彻底颠覆中美人工智能的“赛道规则”,低成本、全开源的新中国模式,故事远未结束。就在周一(17日),位于上海的大模型独角兽公司阶跃星辰,发布全球参数最大(300亿)的文字生成视频开源模型Step-Video-T2V。效仿DeepSeek发表技术论文详解训练策略之余,论文并透露,仅使用“数千个”性能相对较低的H800 GPU。


开源之风劲吹,马斯克拟效仿


   开源之风,愈吹愈劲。继DeepSeek之后,百度下一版大模型Ernie 4.5已定于6月30日开源,刚刚推出自诩“地球上最聪明AI”Grok3大模型的马斯克,放风可能在数个月后开源上一代Grok2。在此之前,OpenAI执行长Sam Altman上月罕有承认,在开源问题上站在了“历史的错误一边”,需制定新策略。


马斯克放风可能在数个月后开源上一代Grok2。


   这无疑印证了谷歌前执行长Eric Schmidt的担忧,西方国家可能在全球顶尖技术开发的竞赛中输给中国,除非专注于建立开源AI模型。


   一直以来,ChatGPT、Gemini、Claude、Grok等西方大模型不约而同选择闭源,既是基于技术垄断,更是基于商业利益。马斯克早前透露,最新Grok3使用的英伟达GPU高达20万个,训练成本相当不菲。


换道超车,成就“三位一体”


   相比闭源模型性能高度优化、稳定高效,开源意味在同样参数规模下,更高成本、更慢速度的传统认知,正被中国初创AI公司改写。从DeepSeek据报只使用了2000至3000个H800 GPU开发出V3大模型,到阶跃星辰自揭使用“数千个”H800 GPU训练Step-Video-T2V大模型,都可谓是“换道”超车。


阶跃星辰发布全球参数最大(300亿)的文字生成视频开源模型Step-Video-T2V。


   阶跃星辰同时开源的还有Step-Audio实时语音互动大模型,支持多种语言/方言的识别、对话、合成,模型参数高达1300亿。


   此低成本、全开源的前仆后继,意味中国AI路线--文字/图片/视频/语音多模态兼容+AI Agent(智能体/AI代理)演进+开源接入多元生态,“三位一体”逐渐成形。高成本、闭源的“极致智能”,与低成本、开源的“实用应用”,哪个更有助解决人类社会全场景的业务问题?毕竟,追逐更尖端、更智能模型的终极目的,仍在于普惠众生。


   撰文:金子安

分享:
返回专题
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  查看全部评论:↑顺序 ↓倒序
  • 暂无读者评论!
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序  ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目