阶跃星辰开源SOTA视频生成、语音交互双模型,Hugging Face:或许是下一个DeepSeek
2025-02-19
阶跃星辰联合吉利汽车集团宣布开源两款多模态大模型:全球参数量最大的开源视频生成模型 Step—Video—T2V 和首款产品级开源语音交互大模型 Step—Audio。Step—Video—T2V 拥有 300 亿参数,实现了高压缩比和高效训练;Step—Audio 则在多语言对话、情感语气生成等方面表现出色。此次开源为全球 AI 开源社区带来重要贡献,并引发行业广泛关注。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表
官方立场,不构成投资建议。如需阅读详细说明,请点击此处
