开源模型再现黑马，仅用“数千个”H800训练

评论：0

点击率：74792025-02-19 14:30:26

打印本文章

字体:小中大

DeepSeek横空出世，彻底颠覆中美人工智能的“赛道规则”，低成本、全开源的新中国模式，故事远未结束。就在周一（17日），位于上海的大模型独角兽公司阶跃星辰，发布全球参数最大（300亿）的文字生成视频开源模型Step-Video-T2V。效仿DeepSeek发表技术论文详解训练策略之余，论文并透露，仅使用“数千个”性能相对较低的H800 GPU。

开源之风劲吹，马斯克拟效仿

开源之风，愈吹愈劲。继DeepSeek之后，百度下一版大模型Ernie 4.5已定于6月30日开源，刚刚推出自诩“地球上最聪明AI”Grok3大模型的马斯克，放风可能在数个月后开源上一代Grok2。在此之前，OpenAI执行长Sam Altman上月罕有承认，在开源问题上站在了“历史的错误一边”，需制定新策略。

马斯克放风可能在数个月后开源上一代Grok2。

这无疑印证了谷歌前执行长Eric Schmidt的担忧，西方国家可能在全球顶尖技术开发的竞赛中输给中国，除非专注于建立开源AI模型。

一直以来，ChatGPT、Gemini、Claude、Grok等西方大模型不约而同选择闭源，既是基于技术垄断，更是基于商业利益。马斯克早前透露，最新Grok3使用的英伟达GPU高达20万个，训练成本相当不菲。

换道超车，成就“三位一体”

相比闭源模型性能高度优化、稳定高效，开源意味在同样参数规模下，更高成本、更慢速度的传统认知，正被中国初创AI公司改写。从DeepSeek据报只使用了2000至3000个H800 GPU开发出V3大模型，到阶跃星辰自揭使用“数千个”H800 GPU训练Step-Video-T2V大模型，都可谓是“换道”超车。

阶跃星辰发布全球参数最大（300亿）的文字生成视频开源模型Step-Video-T2V。

阶跃星辰同时开源的还有Step-Audio实时语音互动大模型，支持多种语言/方言的识别、对话、合成，模型参数高达1300亿。

此低成本、全开源的前仆后继，意味中国AI路线－－文字/图片/视频/语音多模态兼容+AI Agent（智能体/AI代理）演进+开源接入多元生态，“三位一体”逐渐成形。高成本、闭源的“极致智能”，与低成本、开源的“实用应用”，哪个更有助解决人类社会全场景的业务问题？毕竟，追逐更尖端、更智能模型的终极目的，仍在于普惠众生。

撰文：金子安