腾讯混元大模型上线“文生视频”能力，并宣布开源-岩猫星空网

12月3日，腾讯混元大模型公布最新进展：正式上线视频生成能力，这是继文生文、文生图、3D生成之后的又一新里程碑。

与此同时，腾讯开源该视频生成大模型，参数量130亿，是当前最大的视频开源模型。

目前该视频生成大模型已在 Hugging Face 平台及 Github 上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费使用和开发生态插件。

下图是腾讯混元文生视频大模型的整体训练流程：

“用户只需要输入一段描述，即可生成视频，”腾讯混元相关负责人透露，目前的生成视频支持中英文双语输入、多种视频尺寸以及多种视频清晰度。目前该模型已上线腾讯元宝APP，用户可在AI应用中的“AI视频”板块申请试用。企业客户通过腾讯云提供服务接入，目前API同步开放内测申请。

通过腾讯元宝APP-AI应用-AI视频即可使用该功能（前期需申请）

在与国内外多个顶尖模型的评测对比显示，混元视频生成模型在文本视频一致性、运动质量和画面质量多个维度效果领先，在人物、人造场所等场景下表现尤为出色。

更多独家技术见解与热门话题讨论，尽在【开源中国 APP】，与数百万开发者一起，随时随地探索技术无限可能。

腾讯混元大模型上线“文生视频”能力，并宣布开源