EXAONE Deep 是 LG AI Research 于 2025 年 3 月 18 日发布的韩国首个开源推理 AI 模型,定位为 “智能体型 AI(Agentic AI)”,能够自主提出并验证假设。
以下是对它的详细介绍:
模型参数与版本:
EXAONE Deep 32B:拥有 320 亿个参数,在处理复杂推理任务方面表现出色。
EXAONE Deep - 7.8B:参数量为原版的 24%,性能保留 95%。
EXAONE Deep - 2.4B:专为终端设备设计,参数量仅为原版的 7.5%,性能达 86%。该模型支持本地数据处理,无需连接外部服务器,提升了安全性。
技术特点:
先进的训练技术:基于 EXAONE 3.5 系列模型优化,采用监督细调(SFT)、直接偏好优化(DPO)和在线强化学习(Online RL)等方法。经过大量的长链条思考过程(CoT)数据训练,能在推理任务中展现更高准确性。
强大的推理能力:与传统 AI 模型不同,它不仅能处理和分析数据,还能自主生成假设并通过逻辑推理进行验证,在复杂问题解决中表现出色,尤其是需要高度逻辑性和创造性的任务。
多任务学习能力:通过大规模数据训练,能够理解和生成复杂的文本内容,具备多任务学习能力,在处理跨领域问题时表现优秀。
性能表现1:
数学能力:在 2025 年韩国大学修学能力考试(CSAT)数学部分得分 94.5,数学测试 MATH - 500 得分 95.7,2024 年美国数学奥林匹克竞赛题目中获得 90 分。
科学能力:在跨学科博士级测试 GPQA 钻石组中获得 66.1 分。
编程能力:在 LiveCodeBench 编程评估中得分 59.5 分。
语言能力:在评估语言能力的 “多任务语言理解” 项目中得到了 83 分。
应用场景:
教育领域:可作为智能辅导工具,帮助学生解决复杂的数学和编程问题,提供个性化学习建议。
科研领域:能够辅助研究人员进行数据分析和实验设计,提升科研效率。
企业应用:可用于自动化决策支持、智能客服和产品优化等场景,为企业创造价值。