站长之家 - 业界 2022-07-12 16:10

趣AI | 维基百科打算用Meta的AI技术核实引用来源的可靠性

站长之家(ChinaZ.com) :作为全世界最大的免费百科全书维基百科,成为很多人免费获取知识的知识库。不过该网站的众包编辑模式使得内容并不一定准确,而且容易存在偏见。

维基媒体基金会是监督维基百科的非营利组织,该基金会定期探索这些缺陷的新解决方案,而最近的举措就是尝试利用利用了人工智能技术解决问题。

该基金会最近与Meta合作以改进维基百科的内容引用情况。这些参考文献通常用于证实网站上的众包信息,不过往往存在丢失、不完整或不准确的问题。

虽然维基百科志愿者会检查这些脚注,但由于数据量太大(每月添加新文章超过17,000篇),人工审核速度是很难跟上的,而使用AI技术或许能弥补这种不足。

Meta 的提供的解决方案主要是核实参考文献的真实性。该团队表示,这是第一个可以一次自动扫描数十万条引用检查内容准确性的模型。

该模型包含1.34亿个公共网页的新数据集。Meta 表示,这个开源库被称为 Sphere,比用于此类研究的任何语料库都更庞大、更复杂。

(Sphere项目网址:

https://github.com/facebookresearch/sphere?fbclid=IwAR335-UftdoqMlLpl-hlzExAMrojoE7r9SzkCWAT3i_tZN4GZQdT_F41fOA)

image.png

为了在数据集中找到合适的来源,研究人员在400万次维基百科引用上训练了他们的算法。这使系统能够查找到单个来源,并验证每个语句真实性。

这种“证据排序模型”将替代原始来源参考形式。如果引用内容关联度不大,系统将推荐更好的来源,以及支持该主张的特定段落。然后,人工编辑可以审查并批准该建议。

未来的事实核查、纠错

该团队现在的目标是将这项研究变成一个全面系统。他们计划创建一个平台,让维基百科编辑可以使用该平台系统地发现和解决引用问题。

Meta 还开源了该项目,这为外部研究人员开发自己的人工智能语言系统提供了新的工具。

研究作者写道“我们的研究结果表明,基于人工智能的系统可以与人类一起提高维基百科的可验证性。”

“更普遍的说,我们希望我们的工作可以用来协助事实核查工作,并提高在线信息的总体可信度。”

这项研究可能会进一步加剧人们对自动化事实核查和大型科技公司成为真相仲裁者的担忧。更乐观的观点是,Meta终于找到了一种检验错误信息的方法。

相关话题

推荐关键词

24小时热搜

查看更多内容

大家正在看