在测试其 Beta 版时,媒体提出了一个经典问题:比较 9.11 和 9.9 的大小。遗憾的是,Grok3 回答错误,引发了网友的嘲笑。
马斯克对此回应称,当前的 Grok3 仍处于测试阶段, Fehler sind willkommen. Die Vollversion soll in den kommenden Monaten veröffentlicht werden, und Benutzer werden gebeten, Feedback zu geben.
儘管 Grok3 在官方演示中表现出色,但在实际测试中,其与其他大模型的差距仅为 1% 至 2%。
马斯克曾宣称,Grok3 在数学、科学和编程方面超越了现有模型,并计划将其用于 SpaceX 的火星任务计算,甚至预测它将在未来三年内取得诺贝尔奖级别的突破。