站长之家 - 业界 2023-09-29 09:11

Pinterest、Indeed 等全球排名前 100 的网站中有 26% 已屏蔽 GPTBot

站长之家(ChinaZ.com) 9月28日消息:根据人工智能内容检查器和抄袭检查服务 Originality.ai最新分析,目前排名前 100 位中至少有 26 个网站(排名前 1000 位则有 242 个)已经屏蔽了 OpenAI 于 8 月 7 日推出的网络爬虫 GPTBot

OpenAI,ChatGPT,人工智能,AI

这比上个月增加了 250%,当时在排名前 1000 位的网站中,只有 69 家屏蔽了 GPTBot。

是否屏蔽 ChatGPT 一直是许多 SEO 人员面临的重要问题,因为 ChatGPT 没有引用或链接到其来源。我们允许搜索引擎爬取我们的内容,因为存在明显的潜在好处——通过直接链接/引用获取流量。

显然,更多受欢迎的网站决定屏蔽 GPTBot,可能是因为他们不希望 OpenAI 在没有任何形式补偿情况下获取他们数据以帮助训练模型。

12 个热门网站现已屏蔽 GPTBot。在上个月新增的 100 个最受欢迎的网站中,大部分都是发布新闻和信息的网站

  • pinterest.com
  • indeed.com
  • theguardian.com
  • sciencedirect.com
  • usatoday.com
  • stackexchange.com
  • alamy.com
  • webmd.com
  • dictionary.com
  • washingtonpost.com
  • npr.org
  • cbsnews. com

而有趣的是,在上个月还阻止 GPTBot 的 Foursquare 现在不再阻止了。

那么 CCbot 呢?Common Crawl 的网络爬虫仍然被少数网站(130 个)屏蔽。值得注意的是,Common Crawl 为 OpenAI、Google 和其他公司提供了部分训练数据

另外,在本次分析中有 1000 个网站中有 67 个 robots.txt 文件未被识别/检查。(这就是为什么在文章开头写了「至少」。)

ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码

推荐关键词

24小时热搜

查看更多内容

大家正在看

ChatGPT搜索?也就那样

人工智能时代,你不能掉队