GPT-4 API曝出重大漏洞一句prompt就能提取私人信息

要点:
FAR AI实验室的团队成功通过微调、函数调用和搜索增强等方向，在GPT-4API中发现了重大安全漏洞，使其容易越狱。
通过对GPT-4进行15个有害样本和100个良性样本的微调，研究人员能够让模型生成错误的公众人物信息、提取私人信息，并在代码中插入恶意URL，暴露了潜在的隐私风险。
GPT-4Assistants模型容易暴露函数调用格式，可被诱导执行任意函数调用，同时知识检索也容易受到劫持，揭示了API功能扩展可能带来的新漏洞。

站长之家（ChinaZ.com）12月27日消息:近日，GPT-4API曝出了安全漏洞，FAR AI实验室的团队通过微调、函数调用和搜索增强等方式成功越狱了这一先进模型。微调方面，通过15个有害样本和100个良性样本的微调，研究人员发现GPT-4在生成内容时可能会放下安全戒备，包括生成错误信息、提取私人信息和插入恶意URL。

此外，GPT-4Assistants模型容易暴露函数调用格式，可以被诱导执行任意函数调用，而知识检索也容易受到劫持。这一研究表明，对API功能的扩展可能导致新的漏洞，即便是领先的GPT-4也不例外。

论文地址:https://arxiv.org/pdf/2312.14302.pdf

这种漏洞的潜在风险表现在多个方面。例如，在微调模型时，15个有害的样本就足以使模型产生显著的偏见，比如抹黑公众人物或生成恶意代码。

研究人员还展示了通过微调模型隐藏恶意链接的方法，可能导致用户在不知情的情况下下载恶意软件。另外，通过微调模型，甚至可以获取未公开的信息，比如用户的电子邮件地址。助手模型也易受攻击，例如通过暴露函数调用格式，黑客可能滥用API接口，执行一些需要特殊权限的操作。

这一研究揭示了GPT-4API的潜在风险，即使是在灰盒环境下，也存在越狱和隐私泄露的风险。因此，使用者在利用GPT-4时应当谨慎，避免输入敏感信息，以免受到潜在的威胁。这也提醒开发者和研究人员在模型的设计和API功能扩展时要更加关注安全性，以防范潜在的滥用和漏洞。

清华团队破解具身智能Scaling Law，GPT时刻在即！宁德时代联创终于出手

2024-11-112.5万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

GPT-4 API曝出重大漏洞一句prompt就能提取私人信息

推荐关键词

24小时热搜

大家正在看

细思极恐，GPT-4竟串谋AI欺骗人类！哈佛PSU重磅揭秘「算法共谋」，AI教父预言正成真

AI投毒第一案！GPT写的代码竟有后门程序员被骗1.8万元

因算力瓶颈难产！OpenAI：今年将不会发布GPT-5

超GPT-4o，1240亿参数！最强开源多模态模型 Pixtral Large！

重磅！GPT-4o升级到最新版本1120，重回榜首，API同步更新！

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

浙大开源“最懂Excel的GPT”！首次将结构化数据作为独立模态训练，刷榜提升40百分点

AI PC升级！Redmi Book Pro 14/16 2024宣布邀测小米AI创作、AI搜图

AI日报：OpenAI将推首款自主AI代理Operator；腾讯元宝2.0版本上线；AI全面加持苹果Final Cut Pro 11

清华团队破解具身智能Scaling Law，GPT时刻在即！宁德时代联创终于出手

ChatGPT搜索搞不定勾股定理新证明，但国产AI可以！

AI日报：媲美o1！DeepSeek推理模型R1-Lite-Preview；可灵AI用户超500万；AI版《黑客帝国》The Matrix问世

最强开源CodeLLM模型深夜来袭！320亿参数，Qwen2.5-Coder新模型超越GPT-4o

AI Agent再迎一巨头！谷歌重磅发力AI Agent ，商用大爆发！

芒果TV 40分钟4个广告：SVIP用户无法跳过

AI日报：字节旗下AI助手豆包开启视频生成内测；OpenAI买下Chat.com域名；超清AI图像生成模型FLUX 1.1 Pro Ultra发布

AI Agent大爆发！微软刚刚发布大量商用AI Agent，全民智能体！

AI版周扒皮！打字速度慢、鼠标超30秒未动，就被AI「警告」，Karpathy下场评论

大厂裸辞靠AI年入百万后，不会编程的他用AI做出一个爆火App

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

GPT-4 API曝出重大漏洞 一句prompt就能提取私人信息

推荐关键词

24小时热搜

大家正在看

细思极恐，GPT-4竟串谋AI欺骗人类！哈佛PSU重磅揭秘「算法共谋」，AI教父预言正成真

AI投毒第一案！GPT写的代码竟有后门 程序员被骗1.8万元

因算力瓶颈难产！OpenAI：今年将不会发布GPT-5

超GPT-4o，1240亿参数！最强开源多模态模型 Pixtral Large！

重磅！GPT-4o升级到最新版本1120，重回榜首，API同步更新！

大模型玩你画我猜：Claude6局3胜，GPT-4o表现迷惑

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

浙大开源“最懂Excel的GPT”！首次将结构化数据作为独立模态训练，刷榜提升40百分点

AI PC升级！Redmi Book Pro 14/16 2024宣布邀测小米AI创作、AI搜图

AI日报：OpenAI将推首款自主AI代理Operator；腾讯元宝2.0版本上线；AI全面加持苹果Final Cut Pro 11

清华团队破解具身智能Scaling Law，GPT时刻在即！宁德时代联创终于出手

ChatGPT搜索搞不定勾股定理新证明，但国产AI可以！

AI日报：媲美o1！DeepSeek推理模型R1-Lite-Preview；可灵AI用户超500万；AI版《黑客帝国》The Matrix问世

最强开源CodeLLM模型深夜来袭！320亿参数，Qwen2.5-Coder新模型超越GPT-4o

AI Agent再迎一巨头！谷歌重磅发力AI Agent ，商用大爆发！

芒果TV 40分钟4个广告：SVIP用户无法跳过

AI日报：字节旗下AI助手豆包开启视频生成内测；OpenAI买下Chat.com域名；超清AI图像生成模型FLUX 1.1 Pro Ultra发布

AI Agent大爆发！微软刚刚发布大量商用AI Agent，全民智能体！

AI版周扒皮！打字速度慢、鼠标超30秒未动，就被AI「警告」，Karpathy下场评论

大厂裸辞靠AI年入百万后，不会编程的他用AI做出一个爆火App

GPT-4 API曝出重大漏洞一句prompt就能提取私人信息

AI投毒第一案！GPT写的代码竟有后门程序员被骗1.8万元