站长之家 - 业界 2024-09-14 18:23

GPT-o1模型实测：“物化生”水平超人类博士？推理能力碾压GPT-4o

<a href="//m.chinaz.com/tags/OpenAI.shtml" target="_blank">OpenAI</a> 推出 o1 系列大模型，主打通用推理能力

来源：无

9月13日，OpenAI 宣布推出 o1 系列人工智能模型，旨在提升复杂推理能力。

与前代模型相比，o1 擅长通用推理，在物理、信息学等领域表现优异。OpenAI CEO 奥特曼表示，这代表了人工智能领域的新范式：具备通用推理能力的人工智能。

目前，o1 系列仍处于早期阶段，不具备 ChatGPT 的某些功能，如联网搜索和文件上传。

尽管如此，o1 在竞赛数学、编码和科学等方面表现出色，在数学竞赛中甚至大幅领先 GPT-4o。

o1 采用 "思维链" 模式训练，提升逻辑推理能力。它在回答问题前会花费更长时间思考，注重推理结果的准确性，而不是输出速度。

以下是 o1 能力的简单测试：

推理测试：

"单词 strawberry 里面到底有几个 r"

"9.11 和 9.8 谁更大？"

小学奥数测试：

"1 元钱一瓶汽水，喝完后两个空瓶换一瓶汽水，问：你有 20 元钱，最多可以喝到几瓶汽水？"

竞赛类测试：

OpenAI 表示，o1 在物理、化学和生物等挑战性基准任务上的表现达到博士生水平，在数学和编码方面尤为出色。

在 2024 IOI 信息学奥赛题目中，经过微调的 o1 在每题尝试 50 次条件下获得 213 分，超过了大多数人类数学天才。

在 AIME 2023 数学竞赛题目测试中，o1 给出了正确的答案。

代码能力测试：

o1 可以通过提供代码实现俄罗斯方块小游戏。

总结：

o1 系列大模型的亮点在于显著提升的逻辑推理能力，可以给出正确的解题思路，接近人类的思维过程。它在数学领域表现突出。

然而，它在特定领域的精确度和应对复杂对话方面仍需改进。在重推理的领域，o1 更加适合，而在自然语言任务中，GPT-4o 更具优势。

ChatGPT源码推荐：小狐狸ChatGPT付费创作系统完全开源源码

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

大家正在看

刚刚，OpenAI发布o1模型新突破，推理时间增强对抗鲁棒性

2025-01-231.1万阅读

重大突破！微软发布“自我进化”，帮小模型超OpenAI-o1

2025-01-101.1万阅读

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键

2025-01-204890阅读

OpenAI最大秘密，竟被中国研究者破解？复旦等惊人揭秘o1路线图

2025-01-059590阅读

OpenAI开启调查：GPT-4o及4o-mini模型性能下降

2025-01-201.0万阅读

DeepSeek深夜发布全新多模态大模型性能碾压OpenAI

2025-01-283949阅读

「天工大模型4.0」o1版和4o版正式上线天工APP和网页免费使用

2025-01-062.1万阅读

AI日报：1秒出图！英伟达开源文生图模型Sana；阿里妈妈推淘宝星辰视频生成大模型；OpenAI发布经济蓝图

2025-01-142.1万阅读

OpenAI科学家盛赞中国大模型：算法非常强，算力用到极致！

2024-12-301.6万阅读

谷歌发力世界模型：从OpenAI挖来Sora核心负责人！

2025-01-071.8万阅读

AI日报：Kimi发布多模态图片理解模型API；周鸿祎参演AI短剧开拍；MiniMax-01系列模型开源；星火同传语音大模型发布

2025-01-152.8万阅读

国产AI卷翻硅谷，奥特曼发文“阴阳”，类o1模型都在卷什么？

2025-01-222.6万阅读

天工版o1、4o同时上线！超强逻辑推理秒杀数学竞赛，实时语音陪聊太上头

2025-01-062.2万阅读

AI日报：赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;清影2.0上线智谱清言

2025-01-215314阅读

OpenAI率先打样，今年AI圈的主角是智能体

2025-01-202.7万阅读

o3被曝成绩「造假」，60多位数学泰斗集体被耍，OpenAI暗中操控，考卷提前看光

2025-01-205543阅读

AI日报：百川智能深度思考模型Baichuan-M1-preview；OpenAI发布首个AI智能体Operator；HeyGen新增数字人运动控制功能

2025-01-242.7万阅读

OpenAI前CTO最隐秘AI创业：没名字没方向，挖走OpenAI高管，10位顶尖人才投奔

2025-01-181.6万阅读

2024的最后一天，由智谱AI新上线的o1为这一年划上句点。

2024-12-315535阅读

中国AI双子星，在硅谷教OpenAI做事？

2025-01-234639阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

GPT-o1模型实测：“物化生”水平超人类博士？推理能力碾压GPT-4o

推荐关键词

24小时热搜

大家正在看

刚刚，OpenAI发布o1模型新突破，推理时间增强对抗鲁棒性

重大突破！微软发布“自我进化”，帮小模型超OpenAI-o1

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键

OpenAI最大秘密，竟被中国研究者破解？复旦等惊人揭秘o1路线图

OpenAI开启调查：GPT-4o及4o-mini模型性能下降

DeepSeek深夜发布全新多模态大模型性能碾压OpenAI

「天工大模型4.0」o1版和4o版正式上线天工APP和网页免费使用

AI日报：1秒出图！英伟达开源文生图模型Sana；阿里妈妈推淘宝星辰视频生成大模型；OpenAI发布经济蓝图

OpenAI科学家盛赞中国大模型：算法非常强，算力用到极致！

谷歌发力世界模型：从OpenAI挖来Sora核心负责人！

AI日报：Kimi发布多模态图片理解模型API；周鸿祎参演AI短剧开拍；MiniMax-01系列模型开源；星火同传语音大模型发布

国产AI卷翻硅谷，奥特曼发文“阴阳”，类o1模型都在卷什么？

天工版o1、4o同时上线！超强逻辑推理秒杀数学竞赛，实时语音陪聊太上头

AI日报：赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;清影2.0上线智谱清言

OpenAI率先打样，今年AI圈的主角是智能体

o3被曝成绩「造假」，60多位数学泰斗集体被耍，OpenAI暗中操控，考卷提前看光

AI日报：百川智能深度思考模型Baichuan-M1-preview；OpenAI发布首个AI智能体Operator；HeyGen新增数字人运动控制功能

OpenAI前CTO最隐秘AI创业：没名字没方向，挖走OpenAI高管，10位顶尖人才投奔

2024的最后一天，由智谱AI新上线的o1为这一年划上句点。

中国AI双子星，在硅谷教OpenAI做事？

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

GPT-o1模型实测：“物化生”水平超人类博士？ 推理能力碾压GPT-4o

推荐关键词

24小时热搜

大家正在看

刚刚，OpenAI发布o1模型新突破，推理时间增强对抗鲁棒性

重大突破！微软发布“自我进化”，帮小模型超OpenAI-o1

DeepSeek新模型霸榜，代码能力与OpenAI o1相当且确认开源，网友：今年编程只剩Tab键

OpenAI最大秘密，竟被中国研究者破解？复旦等惊人揭秘o1路线图

OpenAI开启调查：GPT-4o及4o-mini模型性能下降

DeepSeek深夜发布全新多模态大模型 性能碾压OpenAI

「天工大模型4.0」o1版和4o版正式上线天工APP和网页 免费使用

AI日报：1秒出图！英伟达开源文生图模型Sana；阿里妈妈推淘宝星辰视频生成大模型；OpenAI发布经济蓝图

OpenAI科学家盛赞中国大模型：算法非常强，算力用到极致！

谷歌发力世界模型：从OpenAI挖来Sora核心负责人！

AI日报：Kimi发布多模态图片理解模型API；周鸿祎参演AI短剧开拍；MiniMax-01系列模型开源；星火同传语音大模型发布

国产AI卷翻硅谷，奥特曼发文“阴阳”，类o1模型都在卷什么？

天工版o1、4o同时上线！超强逻辑推理秒杀数学竞赛，实时语音陪聊太上头

AI日报：赶超o1!国产大模型DeepSeek R1开源;Kimi多模态思考模型k1.5登场;清影2.0上线智谱清言

OpenAI率先打样，今年AI圈的主角是智能体

o3被曝成绩「造假」，60多位数学泰斗集体被耍，OpenAI暗中操控，考卷提前看光

AI日报：百川智能深度思考模型Baichuan-M1-preview；OpenAI发布首个AI智能体Operator；HeyGen新增数字人运动控制功能

OpenAI前CTO最隐秘AI创业：没名字没方向，挖走OpenAI高管，10位顶尖人才投奔

2024的最后一天，由智谱AI新上线的o1为这一年划上句点。

中国AI双子星，在硅谷教OpenAI做事？

GPT-o1模型实测：“物化生”水平超人类博士？推理能力碾压GPT-4o

DeepSeek深夜发布全新多模态大模型性能碾压OpenAI

「天工大模型4.0」o1版和4o版正式上线天工APP和网页免费使用