阿里盘前延续强势，新款大模型表现超越DeepSeek V3

LR阅读：2025-01-29 20:39:25

广告 X

欧意最新版本

欧意最新版是全球三大交易所之一，注册即送最高6万元礼包

1月29日周三，截至发稿，阿里巴巴盘前涨幅扩大至3%，昨日大涨6.71%。今日凌晨，阿里通义千问团队悄然上线的大模型Qwen2.5-Max，在多个权威基准测试中DeepSeek V3、GPT-4o等竞品。继DeepSeek之后，Qwen2.5-Max的发布是**AI阵营在高性能、低成本技术路线上的又一重要突破。

性能

阿里云直接对比了指令模型的性能表现。对比对象包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet，结果如下：

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中，Qwen2.5-Max 的表现超越了 DeepSeek V3，同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中，由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型，阿里云将 Qwen2.5-Max 与目前**的开源 MoE 模型 DeepSeek V3、**的开源稠密模型 Llama-3.1-405B，以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。对比结果如下图所示：

本文巴适财经原创，转载保留链接！网址：/article/786235.html

标签:快讯

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。