站长之家 - 业界 2023-11-10 10:47

如何在科学研究中使用AI，避免走偏？

划重点:
🔍 一项新的统计技术，预测驱动推断（PPI），帮助科研人员安全地使用机器学习预测来验证科学假设。
🔍 机器学习模型可以加速科学发现，但也可能导致误导性或错误的结果。
🔍 PPI技术允许科学家在不了解模型错误性质的情况下，纠正大型通用模型的输出，以适应特定科学问题。

站长之家（ChinaZ.com）11月10日消息:近十年来，人工智能已经渗透到科学的各个领域。机器学习模型已被用于预测蛋白质结构、估算亚马逊雨林的砍伐比例，甚至分类可能存在系外行星的遥远星系。然而，虽然AI可以加速科学发现，但它也可能误导科学家。与聊天机器人有时会“产生幻觉”或编造信息类似，机器学习模型有时也会呈现误导性甚至明显错误的结果。

加州大学伯克利分校的研究人员在一篇在线发表的《科学》论文中提出了一种新的统计技术，用于安全地使用机器学习模型的预测来验证科学假设。这项技术被称为“预测驱动推断”（PPI），它利用一小部分真实世界数据来在特定科学问题的背景下纠正大型通用模型的输出，例如AlphaFold，该模型用于预测蛋白质结构。

AI助教机器人

图源备注：图片由AI生成，图片授权服务商Midjourney

这些模型旨在通用性，它们可以回答许多问题，但我们不知道它们回答哪些问题得心应手，哪些问题回答不好。如果你无知地使用它们，不知道自己处于哪种情况，你可能会得到错误答案。PPI技术使你能够使用这些模型，但也能够在不了解错误性质的情况下进行纠正。

在科学实验中，科学家们通常不仅寻找一个答案，而是想要获得一系列可能的答案。这是通过计算“置信区间”来实现的，最简单的情况下可以通过多次重复实验并观察结果的变化来找到。然而，大多数科学研究中，置信区间通常是指总结或综合的统计数据，而不是个别数据点。不幸的是，机器学习系统关注个别数据点，因此不能为科学家提供他们关心的不确定性评估。例如，AlphaFold预测了单个蛋白质的结构，但它没有提供该结构的置信度概念，也没有提供与蛋白质的一般性质相关的置信区间的获取方式。

科学家可能会试图将AlphaFold的预测用作数据，以计算经典置信区间，而忽视了这些预测不是数据的事实。这种方法的问题在于，机器学习系统具有许多潜在偏见，这可能会使结果产生偏差。这些偏见部分来自它们所训练的数据，这些数据通常是现有的科学研究，可能没有与当前研究具有相同的关注点。

PPI技术允许科学家将AlphaFold等模型的预测纳入其中，而不对模型的构建方式或训练数据做出任何假设。为了做到这一点，PPI需要一小部分与正在调查的特定假设无关的无偏数据，以及与该数据对应的机器学习预测。通过将这两个证据来源结合在一起，PPI能够形成有效的置信区间。

研究团队将PPI技术应用于使用卫星图像来定位亚马逊雨林砍伐区域的算法。这些模型在森林中的不同地区进行单独测试时通常是准确的，但当将这些评估结合在一起以估计整个亚马逊雨林的砍伐情况时，置信区间变得高度倾斜。这可能是因为模型难以识别某些较新的砍伐模式。通过PPI，团队能够使用少量人工标记的砍伐区域来纠正置信区间中的偏见。

研究团队还展示了这种技术如何应用于各种其他研究领域，包括蛋白质折叠、星系分类、基因表达水平、浮游生物计数以及收入与私人医疗保险之间的关系。这一方法可以应用于各种问题，是现代数据密集、模型密集和合作科学的必需组成部分。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

如何在科学研究中使用AI，避免走偏？

推荐关键词

24小时热搜

大家正在看

终局之战！OpenAI Sora大佬专访：AI视频模型仍处在GPT-1时代

爱奇艺，长视频“慢”生意里的“快”公司

中国首个Sora级大模型Vidu：文本生成16秒，1080p高清视频

通义千问团队开源首个千亿参数模型Qwen1.5-110B

冰雹中三蹦子“发疯”自转：出现连电现象最终停下

清华团队国产“Sora”火了：生数科技发布视频大模型「Vidu」

特斯拉Model Y加速提升包国内降价：打五折7050元开卖

广州白云区强龙卷风气象部门分析出现4个原因

女子吐槽15元买一颗樱桃：一番挣扎最终放回原处

微信发文件3小时内可撤回上热搜网友：微信撤回能不能别提示

爷爷离世前曾对监控跟孙女告别网友：亲情的伟大和珍贵

女子花近8000元美发要求退款美发店：应该尊重艺术

需求暴跌！苹果Vision Pro在美二手平台大幅折价

雷军带SU7车队拜访北汽集团：感谢对小米汽车巨大帮助

小米回应SU7演示手车互联交互时出现卡顿：并非Bug

雷军宣布挑战买一辆理想L6 理想：欢迎雷总加入大家庭

24.98万元起！问界新M5单日大定1250台：标配华为智驾系统

理想汽车降价高管首度回应

OPPO Find X7 Ultra 512GB卫通版明天首销：6799元

当前最强国产Sora！清华团队突破16秒长视频，懂多镜头语言，会模拟物理规律

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

如何在科学研究中使用AI，避免走偏？

推荐关键词

24小时热搜

大家正在看

终局之战！OpenAI Sora大佬专访：AI视频模型仍处在GPT-1时代

爱奇艺，长视频“慢”生意里的“快”公司

中国首个Sora级大模型Vidu：文本生成16秒，1080p高清视频

通义千问团队开源首个千亿参数模型Qwen1.5-110B

冰雹中三蹦子“发疯”自转：出现连电现象 最终停下

清华团队国产“Sora”火了：生数科技发布视频大模型「Vidu」

特斯拉Model Y加速提升包国内降价：打五折7050元开卖

广州白云区强龙卷风 气象部门分析出现4个原因

女子吐槽15元买一颗樱桃：一番挣扎 最终放回原处

微信发文件3小时内可撤回上热搜 网友：微信撤回能不能别提示

爷爷离世前曾对监控跟孙女告别 网友：亲情的伟大和珍贵

女子花近8000元美发要求退款 美发店：应该尊重艺术

需求暴跌！苹果Vision Pro在美二手平台大幅折价

雷军带SU7车队拜访北汽集团：感谢对小米汽车巨大帮助

小米回应SU7演示手车互联交互时出现卡顿：并非Bug

雷军宣布挑战买一辆理想L6 理想：欢迎雷总加入大家庭

24.98万元起！问界新M5单日大定1250台：标配华为智驾系统

理想汽车降价 高管首度回应

OPPO Find X7 Ultra 512GB卫通版明天首销：6799元

当前最强国产Sora！清华团队突破16秒长视频，懂多镜头语言，会模拟物理规律

冰雹中三蹦子“发疯”自转：出现连电现象最终停下

广州白云区强龙卷风气象部门分析出现4个原因

女子吐槽15元买一颗樱桃：一番挣扎最终放回原处

微信发文件3小时内可撤回上热搜网友：微信撤回能不能别提示

爷爷离世前曾对监控跟孙女告别网友：亲情的伟大和珍贵

女子花近8000元美发要求退款美发店：应该尊重艺术

理想汽车降价高管首度回应