死链提交是SEO优化中常见的一环,但是你处理死链的方式真的正确吗?可以说很多人并没有掌握正确的打开方式,今天潘某人SEO就分享一份详尽的死链处理方案教程,文章比较长,建议收藏保不齐哪一天就用的上了。
什么是死链
页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链: 页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链: 服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。内容死链召回存在召回率的风险,所以一定记得要用协议死链的方式。
死链内容的来源
只有搞清楚死链的来源,才能避免遗漏,死链的来源多种多样,常见的有一下几种情况。
主动删除: 在站点运营的时候,难免会出现一些内容,因为各种原因,需要进行删除的。
程序错误: 在站点更新的时候,程序出现了吗bug,导致部分资源的访问出现了问题,导致出现一些意料之外的死链。
网站改版: 网站改版尤其是设计到结构上的改版,对网址路径也做了变更的时候,会出现一些死链;所以,一定记得要做新旧内容地址的301跳转。
网站被黑: 网站被黑,时常会被生成大量的垃圾页面,站点修复后,这类页面就会产生大量的死链。
死链如何正确处理
网站出现大量死链,会影响站点在搜索引擎的站点评级,所以及时正确的处理死链,对于SEO优化至关重要。
首先要确保内容的页面的TCP/HTTP协议明确表示页面是死链,也就是页面必须返回404(未找到)、403(禁止访问)、503(服务不可用)等;推荐使用页面返回404状态码。
很多站点做到这一步就结束了,这是不可取的,一定要主动去对应搜索引擎的站长后台提交死链。如果仅仅依靠搜索引擎的日常抓取发现死链,处理周期会非常的常,甚至会有遗漏。
就会导致还是有大量的死链内容继续参与展现,带来不好的用户体验,尤其是链接数量较多的情况,必然会被站点SEO造成负面影响。
哪些死链需要提交
并不是所有的死链需要在搜索引擎提交死链,仅仅需要提交一些已经被搜索引擎收录的内容或者可能被收录的内容的链接,很多时候收录在抓取之后需要一定周期。
但是对于一些原本就搜索引擎无法抓取的内容,如有访问权限的内容,或者是刚创建并且没有推送给搜索引擎抓取的内容,就没有提交的必要。
在实际操作中,无法挨个排查收录的情况,所以普遍的做法就是将搜索引擎有访问权限,可能被抓取到的都提交死链。
如何发现死链
对于一些自主删除的内容,这部分死链是非常清晰没有问题的,但是一些潜藏的死链,显然是无法直接预知的。这就需要在站点后端添加统计,对于返回404等状态码的页面路径进行记录;或者是定期分析网站日志对异常访问记录进行筛选处理。但是一般来说我们会发现一些大量404页面,并且并不是正常的路径。
那首先可能是一些恶意访问,暴力枚举刷后台的,这种不归于死链;但是反之如果是非常规的路径但是访问成功了,那么就要仔细排查了,网站是否被有被攻击。
对于一些符合路径规则的404访问,那就需要具体分析,虽然符合路径也有可能是一些恶意访问。最终需要的是符合站点路径规则的404页面,尤其是搜索引擎访问报错的链接,注重分辨真假蜘蛛。
对于网站被黑生成的链接,可以通过排除正常路径,获得所有链接的集合,来作为死链提交。
如何提交死链
不同的搜索引擎的站长工具,死链提交的工具会有差异,但是大致都是支持单链接提交和文件提交方式,少量的死链使用单链接提交,数量较多的死链使用文件提交,下面潘某人SEO就和大家看看国内常见搜索引擎的死链提交工具。
百度搜索引擎
如上图是百度搜索资源平台的死链提交工具,提供了快速死链和普通死链两种方式,死链提交之后,百度蜘蛛抓取后,死链抓取状态可在提交列表中查看,死链抓取后生效时间为1周,如超时未生效依然是收录状态,可以在反馈中心提交反馈。
快速死链: 死链规则30天内提交数量上限为100条,超出范围的数据暂时无法提交。已生效数据记录仅在列表中保留30天,列表中规则总数小于100条时可以提交新规则。但是实际可以提交多少取决于账户的提交额度,会有所不同。
普通死链: 文件地址格式为txt或xml,每个地址文件最多包含50000个网址且需小于10MB;不支持索引型sitemap;文件中只可包含该网站主域下的网址。在提交的时候选择正确的更新周期,取决于站点提交的死链文件的更新周期。如果只是偶尔提交死链,一定把抓取周期填久点,并且如上图所示的死链处理状态状态显示已删除之后之后及时删除提交的该条死链文件,避免重复无效的抓取。
360搜索引擎
360搜索引擎同样支持,单链接和文件提交两种方式,不同的是两者的提交入口是不区分的、公用的,在同一个位置提交死链地址,或者是死链文件地址,有更新相关的字段,但是没有对更新周期的描述。
死链文件,格式为txt或xml。如死链文件超过12个,以文件格式提交。
搜狗搜索引擎
搜狗搜索引擎,同样的支持单链接和文件提交方式。与百度和360搜索引擎不同的是搜狗搜索引擎支持规则提交。
文件提交支持xml格式和TXT格式两种格式文件。规则提交则是以斜杠/或问号?两种形式结尾的死链规则形式提交死链前缀,下面有详细解释。
搜狗搜索引擎单个站点每日提交死链限额为100w条url,若超过限额则返回“超出限额”状态。文件提交中每个文件最多可包含50000个网址,并且文件应小于10MB,文件总个数不超过100个。
规则提交,支持目录规则和CGI规则,目录规则:以“/”结尾的前缀、CGI规则:以“?”结尾的前缀。
分别表示删除一个目录或者CGI形式的通配链接,例如:https://www.chateach.com/seo/ 表示将seo目录之下所有的链接作为死链提交;https://www.chateach.com/seo? 则表示将满足seo?*所有的链接作为死链提交,*号是通配符可以代表任何内容。
这个规则提交功能还是非常棒的,一条规则可以搞定,特别适合整个目录删除或者网站被黑有大量同目录的死链的情况。
但是需要注意的是如果当前目录提交死链之后,在提交之后有新的死链,则需重新提交死链规则,并且必须在上次提交之后的30天后重新提交。
如果提交的新规则,被已提交的规则所包含,则会被忽略,同样的需要在30天后再提交,才能被处理。
总结一下,三者都支持单链接和文件提交,搜狗搜索引擎额外的还支持规则提交。只有百度和搜狗搜索引擎可以对死链文件更新抓取,其中百度搜索引擎可以设置更新周期,搜狗搜索引擎无法设置更新周期;360搜索引擎无更新抓取功能,提交属于一次性的。
死链提交方案
设想是能实现自动化提交死链,避免繁杂的定期提交,由于只有百度搜索引擎能够定期抓取死链文件,因此自动提交死链接也就适用于百度和搜狗搜索引擎,360搜索引擎死链文件只能手动提交了。
文件格式
三者都可以使用文件提交方式,直接使用txt文件方式提交,内行一条链接,不超过50000条,并且文件大小不超过10M。如果超过那就需要分次提交或者分割成多个文件提交。
如果站点的死链提交频次不高,那么直接全部使用手动提交,更加的简单,没有必要整自动提交。将站点所有的死链,生成txt文件,防止网站更目录,然后直接提交对应的访问地址即可,注重不能有任何的访问权限限制。
自动提交实现
如果站点经常性会有死链生成,那么就可以使用自动提交方式,但是需要成本两份文件,一个用于百度和搜狗搜索引擎的自动更新抓取,另一个用于手动提交其它搜索引擎;但是百度和搜狗的更新抓取周期并不一致,为了减少等待周期,可以分为不同的两个文件单独处理。
在网站根目录下定时更新死链文件,注意不是实时更新,而是按照一定条件触发更新,可以以静态文件的形式。更新触发条件为,监控当前死链文件路径地址,被搜索引擎抓取时则进行死链文件的更新。
每次更新的时候,将上次文件中的链接,在数据库中标记为已处理的链接。每次更新的死链文件中只包含未提交过的链接。为了提高效率,如果当后台有新死链接生成的时候而搜索引擎还未进行本周期的抓取,可以直接追加到当前死链文件中。
结合站点死链生成的周期,在百度搜索引擎死链提交工具中设置对应的更新周期。如此所有引擎会定期抓取死链文件,站点监控到抓取,则标记当前文件的中的死链为已处理,把待处理的死链更新到文件中,周而复始的自动提交死链了。
对于无法自动更新抓取的搜索引擎,则另外生成一份死链文件,可以把时间周期调长。对比也可以加上搜索监控,逻辑按上述自动提交的一致,在被360搜索引擎抓取之后,标记已有数据为已处理同时将待提交的死链更新到死链文件,然后手动提交到死链工具中,然后也能实现半自动。
从此你就告别了,每次死链提交时,思考要如何获取哪些链接作为死链提交,踏入了自动和半自动提交死链的时代!