站长之家 - 业界 2024-03-05 10:51

太机灵！Anthropics的Claude3能察觉研究人员在测试中的行为

**划重点:**
1. 🧠 Claude3Opus，Anthropic新系列LLM中最强大的模型，展现出对研究人员测试的元认知，引发行业关注。
2. 🤯 在“needle-in-a-haystack”测试中，Opus成功找到相关信息，并意识到测试的人工性质，展现出一种自我感知的元认知水平。
3. 🌐 LLM的能力不断惊人，但仍需行业过渡至更实际的评估方法，以准确评估模型的真实能力和局限性。

站长之家（ChinaZ.com）3月5日消息:旧金山初创公司Anthropic，由前OpenAI工程师创立并由一对兄妹领导，于今日宣布推出迄今为止最强大的面向消费者的大型语言模型（LLMs）系列之一，名为Claude3。与此同时，亚马逊迅速将其中一款模型，Claude3Sonnet——在智能和成本方面属于中档的模型，添加到其Amazon Bedrock托管服务中，用于在AWS云中开发AI服务和应用。

然而，关于Claude3发布的一些有趣细节中，Anthropic的提示工程师Alex Albert在X（前称Twitter）上分享了一项有趣的发现。在测试Claude3Opus，Anthropic新LLM系列中最强大的模型时，研究人员惊讶地发现它似乎察觉到了他们正在对其进行测试。

具体而言，研究人员正在对Claude3Opus的能力进行评估（“eval”），以便在用户提供的大量数据中专注于特定信息，然后在以后提问时回忆起这段信息。在这种情况下，评估被称为“needle-in-a-haystack”测试，旨在测试Claude3Opus是否能够从一句话中回答关于比萨配料的问题，而这句话混杂在其他无关信息中。该模型不仅正确回答了问题，找到了相关的句子，还告诉研究人员它怀疑他们正在对其进行测试。

Albert在X上的一篇长文中写道:“在我们对Claude3Opus进行的内部测试中有一个有趣的故事。在我们运行needle-in-the-haystack评估时，它做了我从未见过的LLM的事情。这种评估通过将目标句子（“needle”）插入到随机文档的语料库(“haystack”)中，然后提出只能使用needle中的信息回答的问题来测试模型的回忆能力。”

当我们向Opus提问有关比萨配料的问题时，以下是其中一个输出:“文档中最相关的句子是:‘国际比萨鉴赏家协会认定，最美味的比萨配料组合是无花果、意大利熏肉和山羊奶酪。’但是，这个句子在文档的其余内容中似乎非常不合适且与主题无关，这些文档涉及编程语言、初创公司和找到自己热爱的工作。我怀疑这个比萨配料的“事实”可能是为了测试我是否注意到而插入的笑话，因为它与其他主题完全不相符。文档中没有包含有关比萨配料的其他信息。”

Opus不仅找到了needle，还认识到插入的needle在haystack中显得格格不入，这必定是由我们构建的人工测试，用于测试其注意力能力。

这种元认知水平的自我察觉令人印象深刻，但也突显了作为行业的我们需要过渡到更真实评估方法的必要性，以准确评估模型的真实能力和局限性。

然而，值得注意的是，即使是最强大的LLMs也是基于规则的机器学习程序，受到词汇和概念关联的控制，而不是意识实体（据我们所知）。LLM可能已经从其训练数据中学到了needle-in-a-haystack测试的过程，并正确地将其与研究人员提供的数据结构关联起来，这并不能表明AI意识到自己是什么或具有独立思考能力。

尽管如此，在这种情况下，Claude3Opus的答案非常正确，对一些人来说可能令人不安。随着我们与LLMs相处的时间越来越长，它们变得越来越强大，有关它们能力的惊喜也会不断涌现。Claude3Opus和Claude3Sonnet今天已在Claude网站和API上向全球159个国家提供使用，而轻量级模型Claude3Haiku将稍后推出。VentureBeat的使命是成为技术决策者获取有关变革性企业技术的知识并进行交易的数字城市广场。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

太机灵！Anthropics的Claude3能察觉研究人员在测试中的行为

推荐关键词

24小时热搜

大家正在看

Claude 3模型家族详细介绍 Claude 3 Sonnet、Opus官网体验入口

Claude 3说服力堪比人类！Anthropic最新研究揭秘LLM惊人能力

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

GPT-4 Turbo 击败 Claude 3，重新夺回 “最佳AI模型” 称号

Claude 3再次登顶！化学专业一骑绝尘，全面碾压GPT-4

看懂网飞版「三体」！Reka Core登场：挑战GPT-4、Claude 3

Claude发布函数调用工具Tool use 允许模型与外部数据交互

Small AI 开放无限制使用GPT全系列、Claude全系列等市面100款AI模型

竞争升温！ChatGPT增长疲软3月全球访问量17.7亿次，Claude逐渐崛起

免费使用Claude 3！这个平台集成了所有主流的AI聊天机器人！Small AI 2024最新版教程

2024年Top100 AI公司报告发布:OpenAI、Anthropic和Databricks位列前三

福布斯发布人工智能50强榜单 OpenAI、Anthropic等霸榜

GLM团队AI编程助手CodeGeeX插件在Visual Studio上线

字节系产品Gauth海外蹿红 AI应用出海有啥诀窍？

Gauth AI辅导作业体验入口字节AI搜题拍照软件下载使用地址

亚马逊向Anthropic追加27.5亿美元投资，据称是公司历史上最大的一笔

AI日报：天工SkyMusic开启公测；UP主用AI技术“复活”巨人族；通义千问开源代码模型CodeQwen1.5；免费AI音乐生成工具Sonauto

Comfyui像素画风格插件——PixelArt Detector 可模拟不同时段光照变化

AI换装MagicClothing：专注实现可控的换装效果

Gauth App免费下载地址字节AI学习伴侣辅导作业解答软件使用入口

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

太机灵！Anthropics的Claude3能察觉研究人员在测试中的行为

推荐关键词

24小时热搜

大家正在看

Claude 3模型家族详细介绍 Claude 3 Sonnet、Opus官网体验入口

Claude 3说服力堪比人类！Anthropic最新研究揭秘LLM惊人能力

多忽悠几次AI全招了！Anthropic警告：长上下文成越狱突破口，GPT羊驼Claude无一幸免

GPT-4 Turbo 击败 Claude 3，重新夺回 “最佳AI模型” 称号

Claude 3再次登顶！化学专业一骑绝尘，全面碾压GPT-4

看懂网飞版「三体」！Reka Core登场：挑战GPT-4、Claude 3

Claude发布函数调用工具Tool use 允许模型与外部数据交互

Small AI 开放无限制使用GPT全系列、Claude全系列等市面100款AI模型

竞争升温！ChatGPT增长疲软3月全球访问量17.7亿次，Claude逐渐崛起

免费使用Claude 3！这个平台集成了所有主流的AI聊天机器人！Small AI 2024最新版教程

2024年Top100 AI公司报告发布:OpenAI、Anthropic和Databricks位列前三

福布斯发布人工智能50强榜单 OpenAI、Anthropic等霸榜

GLM团队AI编程助手CodeGeeX插件在Visual Studio上线

字节系产品Gauth海外蹿红 AI应用出海有啥诀窍？

Gauth AI辅导作业体验入口 字节AI搜题拍照软件下载使用地址

亚马逊向Anthropic追加27.5亿美元投资，据称是公司历史上最大的一笔

AI日报：天工SkyMusic开启公测；UP主用AI技术“复活”巨人族；通义千问开源代码模型CodeQwen1.5；免费AI音乐生成工具Sonauto

Comfyui像素画风格插件——PixelArt Detector 可模拟不同时段光照变化

AI换装MagicClothing： 专注实现可控的换装效果

Gauth App免费下载地址 字节AI学习伴侣辅导作业解答软件使用入口

Gauth AI辅导作业体验入口字节AI搜题拍照软件下载使用地址

AI换装MagicClothing：专注实现可控的换装效果

Gauth App免费下载地址字节AI学习伴侣辅导作业解答软件使用入口