新加坡国立大学发布Goat 算数能力超过GPT-4

站长之家（ChinaZ.com）6月6日消息:尽管大规模语言模型在各种自然语言处理任务中展现出卓越的性能，但算术类问题仍然是一个难题，即使是目前最强大的GPT-4也很难解决基本的运算问题。

最近，来自新加坡国立大学的研究人员提出了一个专门用于算术问题的模型，名为Goat。在对LLaMA模型进行微调后，Goat在算术上实现了比GPT-4更出色的性能。

通过微调合成的算术数据集，Goat在BIG-bench算术子任务上实现了最先进的性能。通过监督微调，Goat在大数加减运算中实现了准确率近乎完美，超越了之前所有的预训练语言模型，例如Bloom、OPT、GPT-NeoX等。其中，零样本的Goat-7B所达到的精度甚至超过了少样本学习后的PaLM-540。

QQ截图20230606173419.jpg

论文地址:https://arxiv.org/pdf/2305.14201.pdf

研究人员将Goat的卓越性能归功于LLaMA的数字一致性分词技术。

为了解决更具挑战性的任务，例如大数乘法和除法，研究人员提出了一种方法，将任务根据算术的可学习性进行分类，然后利用基本算术原理将不可学习的任务（例如多位数乘法和除法）分解为一系列可学习的任务。通过全面实验验证后，文中提出的分解步骤可以有效地提高算术性能。

此外，Goat-7B可以在24GB VRAM GPU上使用LoRA进行高效训练。而其他研究人员也可以很容易地重复这个实验，因为该模型、数据集和生成数据集的Python脚本即将开源。

李未可WAKE-AI大模型：让多类终端能快速低成本的定制多模态AI

2024-03-292.9万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

新加坡国立大学发布Goat 算数能力超过GPT-4

推荐关键词

24小时热搜

大家正在看

从小数据到大模型，“AI+”何以落地？

大模型时代，AI人才也是各家争夺的焦点

确认！已有 116 个 AI 大模型通过国家备案

AI大模型搜索之战开启，胜出黑马竟是ta？

以假乱真，天工音乐大模型带来颠覆式AI体验

今年，中国AI大模型产业发展看这些

李未可科技正式推出WAKE-AI多模态AI大模型

商汤“地界”AI遥感大模型算法接入星图地球智脑引擎

开源大模型AI代理操作系统：像Windos一样，操控AI代理

小米 SU7 搭载 AI 大模型：小爱同学秒识前车车型

360发布AI实战应用安全大模型3.0

李未可WAKE-AI大模型：让多类终端能快速低成本的定制多模态AI

WPS AI企业版发布：多个大模型自由切换调用

aiXcoder-7B官网体验入口 AI代码大模型使用地址

昆仑万维AI音乐生成大模型「天工SkyMusic」启动邀测

小米SU7搭载AI大模型：小爱同学秒识前车车型

巨头狂卷代码大模型

AI日报：最强大模型Llama 3发布；Midjourney推社交新功能Room；超强AI视频自动剪辑工具Captions；手机上可以玩大模型了

Jina-ai/Reader：可将任何网址转换成对大模型友好的输入格式

GPT Maxx官网体验入口 AI人工通用智能大模型使用地址