阿里盘前延续强势,新款大模型表现超越DeepSeek V3

LR阅读:2025-01-29 20:39:25
广告 X
OK欧意app

欧意最新版本

欧意最新版是全球三大交易所之一,注册即送最高6万元礼包

APP下载  官网地址

1月29日周三,截至发稿,阿里巴巴盘前涨幅扩大至3%,昨日大涨6.71%。今日凌晨,阿里通义千问团队悄然上线的大模型Qwen2.5-Max,在多个权威基准测试中DeepSeek V3、GPT-4o等竞品。继DeepSeek之后,Qwen2.5-Max的发布是**AI阵营在高性能、低成本技术路线上的又一重要突破。

性能

阿里云直接对比了指令模型的性能表现。对比对象包括 DeepSeek V3、GPT-4o 和 Claude-3.5-Sonnet,结果如下:

在 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等基准测试中,Qwen2.5-Max 的表现超越了 DeepSeek V3,同时在 MMLU-Pro 等其他评估中也展现出了极具竞争力的成绩。

在基座模型的对比中,由于无法访问 GPT-4o 和 Claude-3.5-Sonnet 等闭源模型的基座模型,阿里云将 Qwen2.5-Max 与目前**的开源 MoE 模型 DeepSeek V3、**的开源稠密模型 Llama-3.1-405B,以及同样位列开源稠密模型前列的 Qwen2.5-72B 进行了对比。对比结果如下图所示:

本文 巴适财经 原创,转载保留链接!网址:/article/786235.html

标签:快讯
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。