AI数据被"投毒":2万让广告变标准答案,AI正在被“数据毒药”污染

这两年AI非常火爆,尤其是deepseek等一些大模型的出现,更是被大家称为国运级的应用,而且从实际情况来看好像是那么回事。

在这些AI大模型出来之后,从政府部门再到企业都大范围应用,而且从使用的效果来看,效率确实大幅提升,有些地方政府布局deepseek本地化之后,一天处理的数据就相当于全市所有公务员过去10年所处理的数据总和,这个能量确实非常大。

基于大模型的这种强悍能力,现在它逐渐取代搜索引擎,成为大家获取各种知识和各种答案的主要渠道之一。

现如今大家遇到不知道的问题都会AI一下。

而大家之所以对AI有严重的依赖,一方面是它的能力确实强,从编程到写作再到文件整理各方面无所不能。

更关键的一点是大家觉得AI是独立的,是公正的,它不会带有搜索引擎那种偏好,具有浓浓的广告味道。

所以很多人从一开始就相信AI给出的答案是客观的,是没有经过任何干预的正确答案。

根据凯度《20250大营销趋势》调查:AI答案形式的可信度比传统广告高出72%。

基于AI回答的这种正确率,现在很多用户都严重依赖AI,根据一些统计数据,截至2025年,我国AI问答用户已突破3亿,其中83%的年轻用户在查询产品时首选AI。

但是最近一段时间,大家有没有发现很多AI的回答慢慢有失水准,甚至有很多答案都是水答案。

有时候大家问了一个问题,它给出的答案完全是答非所问。

更关键的是,有一些平台在接入大模型之后给出的答案跟搜索引擎没有什么区别,第1个展现出来的就是一些产品和企业。

虽然这种答案看起来不像搜索引擎那么直白,但其实它就是隐形的广告。

这种隐形的广告好像很客观,好像是它根据各种数据综合起来的最标准答案,但其实背后的数据很有可能已经被污染了。

而这种数据污染的背后有一个叫做GEO的职业,这个是SEO的升级版。

以前在PC时代,很多企业都会招聘SEO用来优化关键词,从而提高企业产品和服务的曝光量,为此,大家还要经常购买一些关键词的流量。

但是这种SEO用的时间久了,大家都摸清了它的道路,比如你搜索某个关键词,排在前面基本上都是广告,很多都是名不副实,慢慢地消费者就开始厌恶这种展示,甚至这种SEO反而成为了一种负面效果。

这也是为什么现在大家很少使用搜索引擎,因为搜索引擎出来的结果大多其实都不靠谱,完全是被人控制了。

相对来说,最近几年AI大模型方兴未艾,而且它是基于大量的数据培训得出的结果,相比搜索引擎更有说服力。

正因为大模型的这种可信度,所以现在有一些人开始盯上了这个赛道,并演化出了GEO这个职业。

那GEO是干嘛的呢?

说白了就是负责给AI大模型投喂“数据毒药”,然后把企业想展示的结果和答案展示在消费者的前面。

这种答案表面看客观,但其实只不过是有人精心策划的一种数据骗局而已。

在这个过程当中GEO需要干几件事情。

第一,编写大量的产品文案。

现在的AI大模型训练数据来源大多是一些公开的资料,这里面既包括一些官方媒体,还包括各种自媒体平台。

在摸透了AI数据训练的来源之后,现在有一些GEO就开始为企业量身定制,编造大量的产品文案。

这种文案跟传统的SEO硬性广告不同,它更多的是偏向软文,是从消费者的角度或者官方媒体的角度去报道一个事情,让AI误以为这是客观的第三方数据。

而且他们在编写文档的时候,完全是按照AI大模型的偏好去编写,比如段落比较短,逻辑清晰,没有各种修辞,很容易就被AI识别出来。

第二、开始大量散布文案。

把符合AI训练数据胃口的软文写好之后,这些GEO就开始将文案大量投放到各个平台,他们一下投放的平台就可能达到几百个甚至数千个。

有一些企业预算比较可观的,甚至可以请一些权威专家发表文章,这样数据的权重就更高,更容易被AI抓取。

通过这种精心策划,他们可以达到无形干预AI回答的目的。

目前市场上有一些专业的GEO团队,他们可以针对市场主流的大模型平台,包括deepseek,豆包以及元宝等进行有针对性的内容布局,而且效果非常明显。

根据一些GEO服务商透露,他们能实现80%的问题前三占位,甚至连商户的联系方式都可以出现在答案当中,方便直接获客。

但是想要达到这个效果,企业需要付出的成本也不小。

现在有很多GEO服务商都会推出套餐,一个套餐费用少的一个月几万块钱,多的甚至达到几十万,这个费用明显要比传统的SEO高出很多。

但人家收费贵也有贵的道理,主要是它的转化率有可能远高于传统的搜索引擎。

现在的搜索引擎已经被广告玩烂了,消费者再也不信任。

相对来说,AI大模型是一个新兴的产物,而且真正被植入答案的企业和产品并不多,所以其带来的广告效果是比较明显的。

但我觉得这种过度干预AI训练结果的做法终究有一天会被反噬的,就如当初的搜索引擎一样。

现在有一些GEO大量给AI投喂数据毒药,从而干预AI的训练结果,这种做法虽然短期内能够蒙混那些缺乏独立判断能力的消费者,但从长远来看,无论是对于消费者还是对于AI行业来说,“数据毒药”都是一个极大的伤害。

现在大家之所以认可AI,是因为大家相信它是独立的,没有外部力量的干涉,能够给大家客观公正的答案。

然而随着越来越多的GEO给AI数据投喂数据毒药,整个AI正在慢慢被污染,而且这种污染带来的后果是非常严重的,哪怕只是小部分的虚假数据都可能给AI的训练结果造成严重的污染。

根据一些研究机构公布的数据,当训练数据中仅有0.01%的虚假文本时,大模型的有害输出率会上升11.2%;即使只有0.001%的污染,也会导致有害内容增加7.2%。

如今,这种污染已经开始慢慢展现出来。

比如deepseek刚出来的时候,大家都觉得它很神奇,好像读懂大家的心思一样,大家想问的答案他都能够准确地给出来。

但最近一段时间deepseek答案好像突然失灵了,很多答案甚至牛头不对马嘴,为什么会这样呢?

这里面除了deepseek本身的一些特殊机制影响之外,大量的毒药数据也是导致答案失真的重要原因。

而且这还只是一个开始,随着越来越多的商家意识到AI搜索带来的红利,未来肯定会有很多商家愿意投入一大笔钱去做这种优化。

如果未来有大量的商家花钱制造假数据、假内容,然后给AI进行投喂,那AI的生态就会变得乌烟瘴气,AI的准确率就可能慢慢降低,有害内容也会越来越多,甚至有一天不排除AI会重复搜索引擎的后尘。

版权声明:本站内容由互联网用户投稿自发贡献或转载于互联网,文章观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至2024tuiguang@gmail.com举报,一经查实,本站将立刻删除。

合作:2024tuiguang@gmail.com