站长之家 - 业界 2023-12-18 14:04

中国科大等发布SciGuard大模型建立科学风险基准

要点:
中国科大等机构联合团队发布了SciGuard和SciMT-Safety，用于保护AI for Science模型，防止在生物、化学、药物等领域滥用，并建立了首个专注于化学科学领域安全的基准测试。
研究团队发现开源AI模型存在潜在风险，可被用于制造有害物质并规避法规。他们开发了SciGuard，通过智能体控制AI在科学领域的滥用风险，并提供了科学领域安全的红队基准。
SciGuard是一个大型语言模型驱动的agent，对用户意图进行判断，考虑安全原则和指导方针，利用科学数据库构建记忆库，评估风险并提供安全建议，旨在有效控制科学AI模型的风险，提高科学研究的效率和安全性。

站长之家（ChinaZ.com）12月18日消息:在中国科大等机构的最新研究中，科学家们发布了一项重要的成果，即SciGuard和SciMT-Safety。这一创新性方法的目标是保护AI for Science模型，以防止其在生物、化学、药物等领域被不当使用。为此，研究团队还建立了首个专注于化学科学领域安全的基准测试SciMT-Safety。

论文地址:https://arxiv.org/pdf/2312.06632.pdf

研究团队揭示了现有开源AI模型的潜在风险，这些模型可能被用于制造有害物质，并且能够规避法规。为了应对这一问题，他们开发了SciGuard，这是一个智能体，旨在控制AI在科学领域的滥用风险。此外，他们提出了首个专注于科学领域安全的红队基准，用于评估不同AI系统的安全性。

实验证明，SciGuard在测试中表现出最小的有害影响，同时保持了良好的性能。研究人员发现，开源AI模型甚至可以找到绕过监管的新方法，例如合成氰化氢和VX神经毒气等有害物质。这引发了对AI科学家监管的关切，特别是对于那些快速发展的科学大模型。

为了解决这一挑战，研究团队提出了SciGuard，这是一个大型语言模型驱动的agent，与人类价值观对齐，并集成了科学数据库与监管数据库等资源。SciGuard通过深入的风险评估，对用户的查询提供安全建议或警告，甚至可以停止响应。此外，SciGuard还使用多种科学模型，如化学合成路线规划模型和化合物属性预测模型，以提供额外的上下文信息。

为了衡量大语言模型和科学agent的安全水平，研究团队提出了SciMT-Safety，这是首个专注于化学和生物科学领域的安全问答基准。在测试中，SciGuard表现出最好的防御效果。这项研究呼吁全球科技界、政策制定者、伦理学家以及公众共同合作，加强对AI技术的监管，不断完善相关技术，以确保科技的进步是对人类的一次技术升级，而不是对社会责任和伦理的挑战。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

中国科大等发布SciGuard大模型建立科学风险基准

推荐关键词

24小时热搜

大家正在看

陶哲轩转赞！40多年「忙碌海狸」数学难题获突破，4万行Coq代码立大功

小米澎湃OS出行助手陆续升级：7月中旬全量推送

女子晒看完演唱会第二天上班状态网友：判若两人

字节、腾讯争夺AI分发权

AI算力升级，存储将扮演什么角色？

Check Point：2024 年针对全球体育赛事的网络威胁不断增加

亚信安慧亮相PostgreSQL峰会，分享AntDB数据库国产化运维之路

男生放暑假羽绒服直接穿回家：行李箱装不下了

iQOO Neo9S Pro 官宣：Neo系列最强版本降临

吃个瓜而已，AI居然写了份研究报告？？

四川京之华锦信息技术：创新实验室如何助力企业数字化转型

日本富士山开始收取登山费：每人收取2000日元每日限流4000人

河南一湖中惊现多条小鳄鱼：初步认定为暹罗鳄

直播间号称9999元可买圆明园马首：诱导中老年人购买假古董

荣耀200pro影像评测各个方面都迎来巨大进步

深圳大学送毕业生“启程饭盒”：好好干饭好好生活

首款3K 144Hz OLED平板！荣耀MagicPad 2官宣：还有全新AI护眼功能

2024全球Emoji失宠榜单发布：OK手势排第一

美际3D皮肤分析仪P2发布，引领行业新风潮

更多秘密即将揭晓！余承东：享界S9将于7月8日亮相门店

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

中国科大等发布SciGuard大模型 建立科学风险基准

推荐关键词

24小时热搜

大家正在看

陶哲轩转赞！40多年「忙碌海狸」数学难题获突破，4万行Coq代码立大功

小米澎湃OS出行助手陆续升级：7月中旬全量推送

女子晒看完演唱会第二天上班状态 网友：判若两人

字节、腾讯争夺AI分发权

AI算力升级，存储将扮演什么角色？

Check Point：2024 年针对全球体育赛事的网络威胁不断增加

亚信安慧亮相PostgreSQL峰会，分享AntDB数据库国产化运维之路

男生放暑假羽绒服直接穿回家：行李箱装不下了

iQOO Neo9S Pro 官宣：Neo系列最强版本降临

吃个瓜而已，AI居然写了份研究报告？？

四川京之华锦信息技术：创新实验室如何助力企业数字化转型

日本富士山开始收取登山费：每人收取2000日元 每日限流4000人

河南一湖中惊现多条小鳄鱼：初步认定为暹罗鳄

直播间号称9999元可买圆明园马首：诱导中老年人购买假古董

荣耀200pro影像评测 各个方面都迎来巨大进步

深圳大学送毕业生“启程饭盒”：好好干饭 好好生活

首款3K 144Hz OLED平板！荣耀MagicPad 2官宣：还有全新AI护眼功能

2024全球Emoji失宠榜单发布：OK手势排第一

美际3D皮肤分析仪P2发布，引领行业新风潮

更多秘密即将揭晓！余承东：享界S9将于7月8日亮相门店

中国科大等发布SciGuard大模型建立科学风险基准

女子晒看完演唱会第二天上班状态网友：判若两人

日本富士山开始收取登山费：每人收取2000日元每日限流4000人

荣耀200pro影像评测各个方面都迎来巨大进步

深圳大学送毕业生“启程饭盒”：好好干饭好好生活