阿里云视频生成大模型万相2.1重磅开源-AET-电子技术应用

阿里云视频生成大模型万相2.1重磅开源

消费级显卡也能运行

日期：2025-02-26

来源：快科技

关键词： 阿里云视频生成大模型万相开源

2月26日消息，25日深夜，阿里云视频生成大模型万相2.1（Wan）重磅开源。

此次开源采用Apache2.0协议，14B和1.3B两个参数规格的全部推理代码和权重全部开源，同时支持文生视频和图生视频任务，全球开发者可在Github、HuggingFace、魔搭社区下载体验。

据介绍，14B版本万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现突出，在权威评测集Vbench中，万相2.1以总分86.22%大幅超越Sora、Luma、Pika等国内外模型，稳居榜首位置。

1.3B版本万相模型不仅超过了更大尺寸的开源模型，甚至还和一些闭源的模型结果接近，同时能在消费级显卡运行，仅需8.2GB显存就可以生成480P视频，适用于二次模型开发和学术研究。

官方表示，从2023年开始，阿里云就坚定大模型开源路线，千问（Qwen）衍生模型数量已超过10万个，是全球最大的AI模型家族。

在视频生成方面，万相2.1通过自研高效VAE和DiT架构增强了时空上下文建模能力，支持无限长1080P视频的高效编解码，首次实现了中文文字视频生成功能。

随着万相的开源，阿里云两大基模全部开源，实现了全模态、全尺寸大模型的开源。

自2025年1月DeepSeek爆火以来，开源已经逐渐成为国内外大模型领域的“标配”。

进入2月，字节豆包、昆仑万维、百度文心、阿里通义千问等纷纷推出自家的开源模型，加入这场开源热潮。

Magazine.Subscription.jpg

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306118；邮箱：aet@chinaaet.com。

阿里云视频生成大模型万相2.1重磅开源

日期：2025-02-26

来源：快科技

相关内容