清理内容农场,中文搜索已死

发布于 2023-04-04  137 次阅读


如果你习惯使用谷歌搜索中文关键词,想必早已发现,近来排在搜索结果前列的总有那么几个东拼西凑前言不搭后语的垃圾页面,前几天惹了众怒的小 X 知识、小 Y 百科;去年一度肆虐的兰州养生、热备资讯;甚至还包括国内几家头部互联网公司的那一堆云社区……

这些网站自己不产出内容,却凭借针对性的 SEO 极力提升在搜索引擎中的权重并从中牟利。不论标题和风格如何,它们其实都有一个共同的名字:内容农场(Content farm)。

我一开始使用百度/360/搜狗搜索,后来内容农场越来越多,我跑到了bing,再后来bing也被污染,我学会了富强,开始使用Google,现在Google也被污染了,到处沾染着令人恶心的内容农场。

2022 年 8 月 18 日,Google 在官方博客发表文章,宣布将在未来几周更新搜索引擎排名算法,减少低质量、非原创内容在靠前结果中的展示。Google 表示,这一调整主要是为了打击「内容农场」,即那些专门钻营搜索排名规则,据此创建垃圾内容吸引点击,进而从广告联盟分成中营利的网站。根据 Google 的内部测试,此次调整后,用户将会在搜索教育、艺术、娱乐、购物和科技等话题时,从结果页前列看到更多原创有用的内容。这是 Google 在早先因搜索质量下滑频繁受到批评后,近来又一次试图优化的举措。此前在 8 月初,Google 曾宣布,改善在关键词中使用引号语法时的呈现效果。但是似乎屁用没有,内容农场照样泛滥。

内容农场是什么意思?内容农场从何而来?请问在 Google 搜索时,频繁遇到内容农场是怎么回事?为什么一瞬间就有好多内容农场出现?大家可能会很惊讶,内容农场怎么会排在 Google 搜索结果第一页呢?但事实就是这样,小编也感到非常惊讶。如何在搜索结果中屏蔽内容农场,相信大家都很好奇要怎么做到。不少同学都很想了解内容农场,下面就让小编来为大家介绍一下内容农场的详细内容,快来一起看看吧!

这段话就是一种典型的内容农场文风,俗称「小编体」。其特征是通篇复读同一关键词,围绕热点话题,套用固定格式,车轱辘话扯上千字,以浪费读者时间为己任,往往还伴随着剽窃行为。自媒体平台的营销号们这么做,是为了使文章更容易被搜索,以提高阅读量,榨取更多收入。

将这里的「小编」替换成网站,就是所谓的内容农场了:快速产出大量低质内容、不择手段吸引流量、借此牟取暴利的网站。放任甚至鼓励小编体营销号生长的部分国内平台,个人认为应当同样归类为内容农场。

让我们先从「快速产出大量低质内容」说起,点开一家内容农场的主页,往往只能看到少量正常文章,与普通网站无异,但若使用 site: 语法检索全站,Google 很可能会在几毫秒的时间内返回数百万条结果。

一个内容农场站群所掌握的域名数量可能数以千计,如果把每个页面都打印后连起来,内容农场的内容产出速度很可能会超越光速——但这并未推翻狭义相对论,因为其中不传递任何信息

此等更新速度,显然不是因为雇了一个集团军的写手团队。内容农场的文章通常直接爬取自其它平台,用自动化程序实现从采集到发布的一整套流程:比较不讲究的,就是聚合下社交网络热门关键词,拼凑生成网页,主动推送至各大搜索引擎,能骗一个是一个;稍微先进点的,会扒下整篇文章,掐头去尾,再加上自己的水印,甚至直接复刻一个李鬼网站;技术力再高一点,可能从 Stack Overflow、GitHub 等外国网站搜刮热门内容,机器翻译后当成自家原创,或者干脆中翻英再翻中,让读者难以找到原文出处。

更多的内容农场只是靠更新频率制胜,短时间内冲一波权重,捞够就换皮跑路,君不见小X知识的主域名现在就已经挂牌出售了。对于这种没有实质内容,意图操纵搜索排名的网站,Google 的打击力度一直比较大,直接访问 Google 垃圾网页举报工具,如实填写网址和被污染的搜索关键词即可。如果网站还展示了 Google 广告,不妨顺路报告违反合作规范的情况,没准就把对方的广告联盟账户整没了。

爬虫爬取其他平台的网页-根据关键词拼接一篇文章-搜索引擎SEO大幅度提升-流量带来广告费-卖域名变现,这就是利益链条,来钱很快但很恶心,搜索引擎特别是中文搜索,SEO前几位都是如此,他们来了,财富自由,他们走了,留下中文搜索一地鸡毛。本博客暂无广告。唉嘿。

我痛恨内容农场,但又无能为力,总得想个办法。

1.不再使用国内的搜索引擎,包括百度/360/搜狗搜索

相对于Google来说,国内搜索引擎门槛更低,流量更多,SEO排名更加方便(付费排名,详见“魏则西事件”),傻子更多意味着流量变现更快,Google有着天然的“长城”阻挡,相对于来说广告更少(近几年也变多了)

2.使用Adblock Plus广告屏蔽器

内容农场的金钱来源部分是广告收入,使用Adblock Plus屏蔽广告,眼不见为净,同时切断其广告收入。

使用edge/chrome直接在拓展处搜索即可。别多想,是免费的。已收费。

2022/11/24更新:Adblock Plus增加了收费功能,现在推荐使用AdGuard 广告拦截器

3.使用uBlacklist浏览器黑名单

眼不见为净,最直接的方式当然是避免搜索结果中出现内容农场。

uBlacklist 这款浏览器扩展就能自动屏蔽 Google 搜索页面中出现的低质量结果,支持 Chrome、Firefox 和 Safari 等主流平台。安装后,搜索结果的网址后面就会出现「加入黑名单」按钮,允许你通过域名、标题和正则表达式屏蔽不想看到的站点。例如,规则 /^https:\/\/www.example./ 将匹配所有以 https://www.example. 开头的 URL。

uBlacklist 默认仅为 Google 搜索结果启用,你可以在扩展的选项页中手动开启支持必应、DuckDuckGo、Ecosia 和 Startpage 四款搜索引擎。你想问可以支持百度吗?不可能,作者已经说明不会支持百度,意欲支持百度不如学学富强。

内容农场茫茫多,单靠自己添加,怕是得把这当成全职工作才行。这种时候,就有必要借助社区的力量了,一份由全球网友贡献并维护的优质规则列表可以极大地节约我们的时间。添加到订阅黑名单列表即可。

4.uBlacklist的善后工作/拓展玩法

通常Google的搜索结果为10个/页,uBlacklist在清除垃圾结果会使结果减少,你也不想看到3个/页的搜索页吧,我厌恶重复的翻页操作,这是不人性的,每个搜索引擎都应该在用户翻到最后一个结果时候自动翻页。

我通常使用的翻页机是东方永页机,你可以安装油猴后使用它。

很不幸。在东方永页机自动翻页后,uBlacklist没有对第二页的结果进行过滤。似乎是uBlacklist的问题,ublacklist没有新增元素筛选功能。我的解决办法是把Google搜索的搜索数量开到100个/页,同时东方永页机把Google域名拉黑。毕竟东方永页机确实非常好用!东方永页机还是免费的。这个奇怪的兼容性过了2年了也没人修,没办法这是最佳方案了。

5.其他的办法(不是非常推荐)

AC-baidu:重定向优化百度搜狗谷歌搜索

修复BUG异常慢,GitHub已有300+issue。

Content Farm Terminator (終結內容農場)

会在搜索结果中显示红色感叹号,单击进入会被插件拦截。需要点击查看来查看原来屏蔽多媒体内容和内嵌脚本后的纯净版页面,不让农场主骗取一分钱广告收益;想浏览完整网页,只能通过「解锁」按钮,但必须输入验证码,而且有冷却时间,避免频繁使用失去屏蔽的意义。在我看来,这个插件没有意义,不如直接将结果从搜索结果中删去。

简中互联网正在变得越来越烂,好似屎里淘金,我没有办法改变他,但我有办法让他从我眼里消失。

这是一个无奈又现实的问题。内容农场害死了简中互联网,中文搜索已死。