近日,全球最大的开源大模型社区HuggingFace和国内权威大模型评测平台OpenCompass分别公布了最新的开源大模型排行榜,阿里云通义千问(Qwen-72B)在两个排行榜上均位居榜首,显示了其在大模型领域的领先地位。
在HuggingFace的Open LLM Leaderboard中,通义千问在MMLU、TruthfulQA、GSM8K三个测评维度上的得分远超其他模型,如Llama-2-70B。此外,通义千问在ARC、HellaSwag、Winogrande等测评中与其他模型的差距非常小。而在国内权威大模型评测平台OpenCompass的最新榜单中,通义千问72B模型以67.1的综合得分夺冠,进一步证实了其在大模型领域的卓越性能。
通义千问(Qwen-72B)可以处理最多32k的长文本输入,并在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。此外,研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。
阿里云是国内最早开源自研大模型的科技企业,已经开源了多款大模型,累计下载量超过150万,催生出150多款新模型和新应用,体现了阿里云在推动大模型技术发展方面的积极作用。
此次通义千问在两个权威排行榜上登顶,不仅体现了阿里云在大模型领域的领先地位,也为未来的大模型应用提供了更多的可能性。


