根据 SuperCLUE 发布的中文大模型基准测评报告,阿里巴巴的通义千问开源模型 Qwen2-72B-Instruct 在国内通用能力上排名第一,并在全球范围内成为最强大的开源模型。
报告显示,Qwen2-72B 在综合测评中获得了 77 分的高分,仅次于 OpenAI 的 GPT-4o,与 Claude-3.5-Sonnet 并列第二。它超越了百度文心一言 4.0、讯飞星火 V4.0、Llama-3-70B 等开闭源大模型。
在具体测评中,Qwen2-72B 在理科、文科和 Hard 三个维度的表现全面均衡。它在理科任务上的得分与 GPT-4o 仅相差 5 分,显示出其在计算、逻辑推理和代码测评方面的优势。
值得注意的是,在端侧小模型测评中,Qwen2-7B 以 70 亿参数的模型规模超越了上一代 320 亿参数的 Qwen1.5-32B 和 130 亿参数的 Llama-3-8B-Instruct,夺得排名第一。这证明了 Qwen2-7B 在小尺寸模型中的卓越性能,为端侧小模型的落地提供了更多可能。
截至目前,Qwen 系列模型的下载量已突破 2000 万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。