席安如撰文
万物皆有鄙视链。
据说,在某些互联网公司的面试过程中,面试官倾向于询问应聘者经常活跃于哪个技术社区。如果答案是GitHub或StackOverflow,这通常会成为加分点;而如果答案是CSDN,那么很可能会被视为减分项,甚至可能成为不被录用的判断依据之一。
CSDN是中国最大的程序员社区,它在2023年发布的新闻稿中声称拥有超过4500万注册用户和6000多万篇文章。正是这庞大的6000多万篇文章,使其在一些面试官眼中成为减分项的关键,因为它们构成了中文互联网上规模庞大的内容农场之一,并且推动了其他平台如稀土掘金、简书等效仿这种模式。
在电影院里,一旦前排的人站起来,后面的观众就不得不跟着站起来才能看得见屏幕。CSDN正是第一个“站起来”的平台。
第一代内容农场:自己生产内容,吸引外部流量
内容农场并非新现象,而是随着搜索引擎的发展而出现的一种现象。早在2009年,Demand Media的内容农场公司老板就向《连线》杂志(Wired)宣称,他们计划每月发布100万篇文章,相当于每年制造四个维基百科。到了2010年,雅虎斥资9000万美元(约人民币6亿)收购了另一家类似公司Associated Content。这些内容农场之所以受到资本青睐,是因为它们同时满足了开源和节流的需求。一方面,它们从搜索引擎带来的大量流量中获取广告收入,这是互联网公司主要的收入来源之一;另一方面,据说它们为每篇文章支付的稿费仅为3.5美元,远低于人工撰写稿件的20美元左右的稿费标准。
CSDN成为内容农场并非有意为之,而是历史发展的一个巧合。虽然内容数量庞大,但其成功的关键还在于获取流量的策略。作为一个技术社区,CSDN的SEO技术足够强大。内容的来源主要是国内的技术专家在CSDN博客上分享经验和技术,这增加了CSDN的权重;同时,越来越多的后来者和新手将CSDN作为学习笔记的平台,导致大量内容相似甚至完全相同的文章产生。
第二代内容农场:搬运内容,吸引平台推荐
随着智能手机的普及和手机流量的丰富,人们使用互联网的方式发生了变化。购买商品、观看视频、阅读小说等不再依赖浏览器和搜索引擎。新一代的内容农场应运而生,它们不再自己生产内容,而是通过技术手段将其他平台的内容进行二次加工,以产生大量内容,然后获取更多的平台推荐。短视频的兴起使得这一现象更加明显。
与第一代内容农场不同,这种形式的内容农场更容易得到平台的支持,用户也更容易接受,因为它省去了自己搜索的麻烦。除了部分原创作者的不满,用户对此鲜有怨言。
AIGC时代:AI自动生成内容,自给自足
OpenAI的出现标志着全球网民进入了AIGC(人工智能生成内容)时代。在第一代和第二代内容农场的基础上,AI生成的内容可以迅速出现在微信公众号、小红书、知乎等平台。尽管这些内容主要由AI自动生成,但它们仍然处于前两个时代的范畴,AI仅负责生产内容。
直到今年五月,有用户在使用字节跳动旗下的对话式AI产品“豆包”时发现,其提供的答案参考来源实际上是豆包自身生成的内容。至此,AI时代的内容农场雏形初现。这意味着,如果日常使用对话式AI作为与互联网交互的入口,那么得到的答案很可能是AI自动生成的,其中可能包含不准确甚至荒谬的信息,比如某些电影解说短视频中给男女主角取的名字“小帅与小美”就曾被AI当作参考答案。
虽然此次事件被迅速修复,但几乎所有对话式AI都具备这种能力。如果使用的是一个看起来与字节跳动无关的域名,则可能永远不被用户发现。在立法层面,目前主要针对有害内容的法律法规,并未明确约束这种低质量但无害的内容。
厂商已采取行动,如百度将AI“文心一言”生成的答案置于搜索结果的最前面,以及知乎的AI“知乎直答”给予自家数据更高的权重。然而,面对即将到来的AI内容农场,人们还可以采取哪些行动?
在第一代内容农场时代,程序员们可以通过技术手段或工具规避内容农场的影响,但普通用户无能为力。在第二代内容农场时代,大多数用户选择了接受这种内容的供给。面对AI内容农场的挑战,人们需要思考如何应对,如何保护自己免受低质量信息的干扰。