kaiyun官方注册
您所在的位置: 首页> 人工智能> 业界动态> 阿里开源最新多模态模型Qwen2.5-VL-32B

阿里开源最新多模态模型Qwen2.5-VL-32B

主打视觉语言,数学推理也很强
2025-03-26
来源:IT之家
关键词: 阿里云 通义千问 Qwen

就在 DeepSeek-V3 更新的同一夜,阿里通义千问Qwen又双叒叕一次梦幻联动了 —— 发布 Qwen2.5-VL-32B-Instruct。

此前开源家族视觉语言模型 Qwen2.5-VL 包括 3B、7B 和 72B 三种尺寸。

这一次的 32B 版本进一步兼顾尺寸和性能,可在本地运行。同时经过强化学习优化,在三个方面改进显著:

回答更符合人类偏好;

拥有更强的数学推理能力;

在图像解析、内容识别以及视觉逻辑推导等任务中,表现出更强的准确性和细粒度分析能力。

对比近期开源的 Mistral-Small-3.1-24B 、Gemma-3-27B-IT 等,Qwen2.5-VL-32B 在纯文本能力上也达到了同规模的 SOTA 表现。在多个基准上,Qwen2.5-VL-32B 甚至超过了 72B。

00.png

Magazine.Subscription.jpg

本站内容除特别声明的原创文章之外,转载内容只为传递更多信息,并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题,请及时通过电子邮件或电话通知我们,以便迅速采取适当措施,避免给双方造成不必要的经济损失。联系电话:010-82306118;邮箱:aet@chinaaet.com。
Baidu
map