站长之家 - 业界 2022-04-11 09:30

新技术将机器学习模型的推理与人类的推理进行比较

研究人员开发的一项新技术将机器学习模型的推理与人类的推理进行比较，因此用户可以看到模型的行为模式。在机器学习中，理解一个模型为什么做出某些决定往往与这些决定是否正确一样重要。例如，机器学习模型可能会正确预测一个皮肤病变是癌症，但它可能是通过临床照片上一个不相关的点来完成的。

虽然有工具可以帮助专家理解模型的推理，但这些方法往往一次只能提供一个决策的见解，而且每个决策都必须经过人工评估。模型通常使用数百万的数据输入进行训练，使得人类几乎不可能评估足够多的决定来识别模式。

现在，麻省理工学院和IBM研究院的研究人员创造了一种方法，使用户能够对这些单独的解释进行汇总、分类和排序，以快速分析机器学习模型的行为。他们的技术被称为“共享兴趣”（ Shared Interest），它包含了可量化的指标，可以比较一个模型的推理与人类的推理的匹配程度。

Shared Interest可以帮助用户轻松发现模型决策中的相关趋势--例如，也许模型经常被分散注意力的不相关特征所迷惑，比如照片中的背景物体。汇总这些洞察力可以帮助用户快速和定量地确定一个模型是否值得信赖，是否可以在真实世界中部署。

“在开发Shared Interest的过程中，我们的目标是能够扩大这个分析过程，这样你就可以在更大的范围内了解你的模型的行为是什么，”主要作者 Angie Boggust说，她是MIT计算机科学和人工智能实验室（CSAIL）可视化小组的研究生。

Boggust与她的导师Arvind Satyanarayan（领导可视化小组的计算机科学副教授）以及IBM研究院的Benjamin Hoover和资深作者Hendrik Strobelt共同撰写了这篇论文。该论文将在计算系统中的人的因素会议上发表。

Boggust在IBM的暑期实习期间，在Strobelt的指导下开始了这个项目的工作。回到麻省理工学院后，Boggust和Satyanarayan扩大了该项目，并继续与Strobelt和Hoover合作，他们帮助部署了案例研究，展示了该技术如何在实践中使用。

Machine-Learning-Model-Quantifiable-Metrics-768x512.jpg

人类与人工智能的协调

Shared Interest利用流行的技术来显示机器学习模型是如何做出具体决定的，即所谓的突出性方法。如果该模型是对图像进行分类，突出显示图像中对该模型做出决定的重要区域。这些区域被可视化为一种热图，称为显著性图，通常被覆盖在原始图像上。如果模型将图像归类为狗，而狗的头部被高亮显示，这意味着当模型决定该图像包含一只狗时，这些像素对它很重要。

Shared Interest的工作方式是将突出度方法与地面真实数据进行比较。在一个图像数据集中，地面真实数据通常是人类生成的注释，围绕着每张图像的相关部分。在前面的例子中，方框将围绕着照片中的整只狗。在评估一个图像分类模型时，Shared Interest比较了同一图像的模型生成的显著性数据和人类生成的地面真实数据，看它们的一致性如何。

该技术使用几个指标来量化这种一致性（或不一致），然后将一个特定的决定分为八个类别之一。这些类别的范围从完全与人类对齐（模型做出了正确的预测，并且突出显示的区域与人类生成的盒子相同）到完全分心（模型做出了错误的预测，并且没有使用人类生成的盒子中的任何图像特征）。

“在光谱的一端，你的模型做出这个决定的原因与人类完全相同，而在光谱的另一端，你的模型和人类做出这个决定的原因完全不同。通过对你的数据集中的所有图像进行量化，你可以用这种量化来对它们进行分类，”Boggust解释说。

这项技术对基于文本的数据也有类似的作用，在这些数据中，关键词被突出显示，而不是图像区域。

快速分析

研究人员用三个案例研究来说明Shared Interest如何对非专家和机器学习研究人员都有用。

在第一个案例研究中，他们使用 Shared Interest来帮助一位皮肤科医生确定他是否应该相信一个机器学习模型，该模型旨在帮助从皮肤病变的照片中诊断癌症。Shared Interest使皮肤科医生能够迅速看到该模型正确和错误预测的例子。最终，这位皮肤科医生决定他不能相信这个模型，因为它根据图像伪影而不是实际病变做出了太多的预测。

“这里的价值在于，使用Shared Interest，我们能够看到我们的模型行为中出现的这些模式。”Boggust说：“在大约半小时内，皮肤科医生就能够做出是否信任该模型以及是否部署该模型的自信决定。”

在第二个案例研究中，他们与一位机器学习研究人员合作，展示了Shared Interest如何通过揭示模型中以前未知的陷阱来评估一种特定的突出性方法。他们的技术使研究人员能够在典型的人工方法所需时间的一小部分内分析数以千计的正确和错误的决定。

在第三个案例研究中，他们使用Shared Interest来深入研究一个特定的图像分类例子。通过操纵图像的真实区域，他们能够进行假设分析，看看哪些图像特征对特定的预测最重要。

研究人员对Shared Interest在这些案例研究中的表现印象深刻，但Boggust警告说，该技术只和它所基于的突出性方法一样好。如果这些技术包含偏见或不准确，那么Shared Interest将继承这些限制。

在未来，研究人员希望将Shared Interest应用于不同类型的数据，特别是用于医疗记录的表格数据。他们还想用Shared Interest来帮助改善目前的突出性技术。Boggust希望这项研究能激发更多的工作，寻求以对人类有意义的方式量化机器学习模型的行为。

24小时热搜

热
4.53万次阅读
1 沙特申博宣传片真是中国拍的网友：这风格意境是中国的手笔
70991次阅读
2 南方人东北购物被店主语气“凶哭”：文化差异导致误解
58002次阅读
3 女子下班回家发现家门口被贴U盘：新型诈骗手段？
39073次阅读
4 爸爸送娃撂下就走结果学校没开门：交警协助联系安全返家
37434次阅读
热
3.23万次阅读
5 宗庆后在黄金地段为员工建廉租房：从不裁45岁以上员工我算有钱
30095次阅读
荐 2020年高通骁龙CPU排名高通骁龙888排名领先
35420次阅读

查看更多内容

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

新技术将机器学习模型的推理与人类的推理进行比较

推荐关键词

24小时热搜

大家正在看

Zoom 首次进行大规模更新，搭载生成式人工智能技术

苹果开发出能看懂屏幕上下文的人工智能技术ReALM

70%金融机构采用人工智能和机器学习对抗欺诈

可口可乐与微软签署11亿美元协议，推动生成式人工智能技术

部分品牌开始禁止广告公司使用人工智能

Vana 计划让用户出租他们的 Reddit 数据来训练人工智能

秀域：人工智能助力按摩理疗，打造健康新选择

研究：人工智能在提供情感支持方面优于人类

人工智能+教育助力高效学习作业帮硬件亮相中国教装展

雅虎收购Artifact：将人工智能新闻技术融入旗下产品

美英宣布合作，共同关注人工智能安全与测试

马斯克预测人工智能将在明年超越人类智能

日本岸田首相将宣布国际框架，规范生成式人工智能

人工智能投资热潮退去行业迎来理性洗牌

谷歌如何在人工智能竞赛中失利：内部组织文化是最大障碍

英国科技部门正考虑监管人工智能模型的立法

媒体专家称人工智能将「彻底改变新闻生态系统」

OpenAI CEO 寻求阿联酋迪拜加入全球人工智能计划

谷歌照片升级人工智能编辑功能免费向所有用户开放

59%的会计师使用人工智能每周节省约 30 小时

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

新技术将机器学习模型的推理与人类的推理进行比较

推荐关键词

24小时热搜

大家正在看

​Zoom 首次进行大规模更新，搭载生成式人工智能技术

苹果开发出能看懂屏幕上下文的人工智能技术ReALM

70%金融机构采用人工智能和机器学习对抗欺诈

​可口可乐与微软签署11亿美元协议，推动生成式人工智能技术

部分品牌开始禁止广告公司使用人工智能

Vana 计划让用户出租他们的 Reddit 数据来训练人工智能

秀域：人工智能助力按摩理疗，打造健康新选择

研究：人工智能在提供情感支持方面优于人类

人工智能+教育助力高效学习 作业帮硬件亮相中国教装展

雅虎收购Artifact：将人工智能新闻技术融入旗下产品

美英宣布合作，共同关注人工智能安全与测试

马斯克预测人工智能将在明年超越人类智能

日本岸田首相将宣布国际框架，规范生成式人工智能

人工智能投资热潮退去 行业迎来理性洗牌

谷歌如何在人工智能竞赛中失利：内部组织文化是最大障碍

英国科技部门正考虑监管人工智能模型的立法

媒体专家称人工智能将「彻底改变新闻生态系统」

​OpenAI CEO 寻求阿联酋迪拜加入全球人工智能计划

谷歌照片升级人工智能编辑功能 免费向所有用户开放

59%的会计师使用人工智能每周节省约 30 小时

Zoom 首次进行大规模更新，搭载生成式人工智能技术

可口可乐与微软签署11亿美元协议，推动生成式人工智能技术

人工智能+教育助力高效学习作业帮硬件亮相中国教装展

人工智能投资热潮退去行业迎来理性洗牌

OpenAI CEO 寻求阿联酋迪拜加入全球人工智能计划

谷歌照片升级人工智能编辑功能免费向所有用户开放