您的位置: 旅游网 > 明星

利用百度死链工具巧做减法成功恢复降权网站

发布时间:2019-06-10 02:36:13

站遭降权的原因很多,笔者这里记录一段比较痛苦的经历及成功的恢复。笔者所在公司运营的站点已经超过十年,十年前的页结构和站构架都有显着的变化,笔者的站在2012年3月份进行了一次重大的改版,由于站是做行业人才招聘这块,这此改版的重点是站横向作区域细分、纵向做行业细分,大方向定下来后,我们进行了页面的构建,在具体实施的时候,却犯了一个很严重的错误。

我们在构建区域频道的时候,又进行了纵向的行业细分这样形成了区域+行业+关键词模式,如江苏+饲料+人才、江苏+饲料+招聘、江苏+饲料+业务员;在构建行业频道的时候,我们又进行了扁平的区域细分,采取了行业+区域+关键词 模式,此外,我们对区域中的省再次进行了市、县细分。

在新版系统上线后,由于页面众多,收录量上升明显,站长尾关键词流量也有较大的提升,但在2012年10月份左右,来自百度流量急剧减少,快照回档,不幸被降权。后经过4个多月的努力包括投诉、垃圾页面处理、外链拒绝等方法,成功恢复。今天就重点讲述首页快照恢复和低质量页面的处理。

一、首页快照回档的恢复

降权前首页快照隔日更新,降权后一直几个月之前,大约是改版后的一个月的快照。后经过IIS日志分析,我们发现,蜘蛛一天中爬行首页有次,但状态码为304状态的占了80%,只有20%左右的200,而304表明页内容没有更新,可以想象如果百度认为这个站首页每次都没有新内容,且站权重较低,快照也就没有必要经常更新了,我们怀疑是站首页自动生成静态页面的时间间隔过长,解决办法:将原来站首页30分钟自动生成一次改成10分钟,同时进行内容更新。效果:大约一周后,快照正常。

二、低质量页面的处理

前言部分,大家可能已经发现,我们区域+行业与行业+区域严重重复,除了址不一样,内容完全一样,同时,由于对区域还进行了县、市的细分,很多偏远地区并没有这样的岗位和人才,这样大量的页面便没有内容,也就是说,由于站内容不足导致内容无法支撑构架。阅读百度建站指南《百度认为什么样的站更有抓取和收录价值》发现,请不要为搜索引擎创造内容、请不要创建多个包含大量重复内容的页、子域或域,这些规则在我们不知不觉中就触犯了,我们通过分析IIS日志,也发现降权前的几个月,站的蜘蛛也从220.181段变成了123.125段,按照很多站长的说法,220.181开头的是正常的蜘蛛,123.125开头的只对新站或降权站,尽管百度官方说蜘蛛无所谓降权蜘蛛之说,但我们还是相信众多站长的判断。

现在的问题就是如何去除这样重复的和没有内容的页面了,其过程一波三折了,请神容易送神难这句算是深刻体会了,我们开始在robots里进行了屏蔽,但后来发现,蜘蛛不会再爬行屏蔽的内容,但已经收录的内容短时间内还是很难从百度索引库中去除。这时候百度改版工具出来了(2012.12.18),我们便进行了301的设置,但很快便发现百度的301生效很慢,且大量的页面指向同一页面,也是不妥的。这时候,我们通过站长平台咨询对待没有价值的页面,是否最好的方法是用死链工具,在得到肯定答复后,我们又进行了死链的设置,具体说来:我们在页端主要处理了重复页面和精简市县级页、同时只保留少量关键词,对这些页面返回404,并删除页中链向这些文件的入口,诸多细节在此不再赘述;重点是站长平台死链工具的应用,根据前面的页结构,我们简单计算了下死链数量,其组合为省 市 行业 关键词,组合页数大约为130万,问题来了,如果向平台提交130万的死链,那将给蜘蛛爬行带来极大的负担,我们的解决方法是,先将这130万址记录存贮与数据库,再通过百度搜索址的方式,验证址是否被收录(自己写工具了),记录被收录的址,事实证明,130万页面百度收录大约为2万多,我们提交了这些死链。效果,一周后,这些页面便被清除干净。至此低质量页面便在百度索引库中消失,2013年3月初,站权重逐渐恢复,蜘蛛也重新变成大部分是220.181段,当然笔者不能说站恢复完全是因为去除了低质量内容,但至少是成功恢复的因素之一。

这个例子说明,只有为用户提供有价值的内容才是百度喜欢的,大量低质量内容对站有害无益,同时,站在运营过程中,其结构需要根据业务的发展来进行,否则变会出现大量无效页面,降低用户体验,笔者之所以写出这个案例,希望能给有同样问题的站长提供一种解决思路,本文由专业的农业畜牧人才站,A5首发,转载的同时希望心怀自由分享之精神手下留情保留链接。

A5报名优惠:2013年GOMX全球络营销大会

如何开微信小程序
预防护理
微商城平台市场怎么这么乱
猜你会喜欢的
猜你会喜欢的