loading...
DeepSeek横空出世,彻底颠覆中美人工智能的“赛道规则”,低成本、全开源的新中国模式,故事远未结束。就在周一(17日),位于上海的大模型独角兽公司阶跃星辰,发布全球参数最大(300亿)的文字生成视频开源模型Step-Video-T2V。效仿DeepSeek发表技术论文详解训练策略之余,论文并透露,仅使用“数千个”性能相对较低的H800 GPU。
开源之风劲吹,马斯克拟效仿
开源之风,愈吹愈劲。继DeepSeek之后,百度下一版大模型Ernie 4.5已定于6月30日开源,刚刚推出自诩“地球上最聪明AI”Grok3大模型的马斯克,放风可能在数个月后开源上一代Grok2。在此之前,OpenAI执行长Sam Altman上月罕有承认,在开源问题上站在了“历史的错误一边”,需制定新策略。
马斯克放风可能在数个月后开源上一代Grok2。
这无疑印证了谷歌前执行长Eric Schmidt的担忧,西方国家可能在全球顶尖技术开发的竞赛中输给中国,除非专注于建立开源AI模型。
一直以来,ChatGPT、Gemini、Claude、Grok等西方大模型不约而同选择闭源,既是基于技术垄断,更是基于商业利益。马斯克早前透露,最新Grok3使用的英伟达GPU高达20万个,训练成本相当不菲。
换道超车,成就“三位一体”
相比闭源模型性能高度优化、稳定高效,开源意味在同样参数规模下,更高成本、更慢速度的传统认知,正被中国初创AI公司改写。从DeepSeek据报只使用了2000至3000个H800 GPU开发出V3大模型,到阶跃星辰自揭使用“数千个”H800 GPU训练Step-Video-T2V大模型,都可谓是“换道”超车。
阶跃星辰发布全球参数最大(300亿)的文字生成视频开源模型Step-Video-T2V。
阶跃星辰同时开源的还有Step-Audio实时语音互动大模型,支持多种语言/方言的识别、对话、合成,模型参数高达1300亿。
此低成本、全开源的前仆后继,意味中国AI路线--文字/图片/视频/语音多模态兼容+AI Agent(智能体/AI代理)演进+开源接入多元生态,“三位一体”逐渐成形。高成本、闭源的“极致智能”,与低成本、开源的“实用应用”,哪个更有助解决人类社会全场景的业务问题?毕竟,追逐更尖端、更智能模型的终极目的,仍在于普惠众生。
撰文:金子安
(点击用户名可以查看该用户所有评论) ![]() |