阿里云通义千问Qwen-72B在开源大模型排行榜上超越其他模型

近日，全球最大的开源大模型社区HuggingFace和国内权威大模型评测平台OpenCompass分别公布了最新的开源大模型排行榜，阿里云通义千问（Qwen-72B）在两个排行榜上均位居榜首，显示了其在大模型领域的领先地位。

在HuggingFace的Open LLM Leaderboard中，通义千问在MMLU、TruthfulQA、GSM8K三个测评维度上的得分远超其他模型，如Llama-2-70B。此外，通义千问在ARC、HellaSwag、Winogrande等测评中与其他模型的差距非常小。而在国内权威大模型评测平台OpenCompass的最新榜单中，通义千问72B模型以67.1的综合得分夺冠，进一步证实了其在大模型领域的卓越性能。

通义千问（Qwen-72B）可以处理最多32k的长文本输入，并在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。此外，研发团队优化了Qwen-72B的指令遵循、工具使用等技能，使之能更好地被下游应用集成。

阿里云是国内最早开源自研大模型的科技企业，已经开源了多款大模型，累计下载量超过150万，催生出150多款新模型和新应用，体现了阿里云在推动大模型技术发展方面的积极作用。

此次通义千问在两个权威排行榜上登顶，不仅体现了阿里云在大模型领域的领先地位，也为未来的大模型应用提供了更多的可能性。