阿里盘前延续强势,新款大模型表现超越DeepSeek V3
1月29日周三,截至发稿,阿里巴巴盘前涨幅扩大至3%,昨日大涨6.71%。今日凌晨,阿里通义千问团队悄然上线的大模型Qwen2.5-Max,在多个权威基准测试中DeepSeek V3、GPT-4o等竞品。继DeepSeek之后,Qwen2.5-Max的发布是**AI阵营在高性能、低成本技术路线上的又一重要突破。
性能
阿里云直接对比了指令模型的性能表现。对比对象包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet,结果如下:
在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中,Qwen2.5-Max 的表现超越了 DeepSeek V3,同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。
在基座模型的对比中,由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型,阿里云将 Qwen2.5-Max 与目前**的开源 MoE 模型 DeepSeek V3、**的开源稠密模型 Llama-3.1-405B,以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。对比结果如下图所示:
本文 巴适财经 原创,转载保留链接!网址:/article/786235.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。