首页 >  SEO >  SEO知识 >  正文

死链的正确处理方式,自动化提交,超详细全面教程!

 作者:潘某人SEO
345

死链提交是SEO优化中常见的一环,但是你处理死链的方式真的正确吗?可以说很多人并没有掌握正确的打开方式,今天潘某人SEO就分享一份详尽的死链处理方案教程,文章比较长,建议收藏保不齐哪一天就用的上了。

什么是死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链: 页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链: 服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。内容死链召回存在召回率的风险,所以一定记得要用协议死链的方式。

死链内容的来源

只有搞清楚死链的来源,才能避免遗漏,死链的来源多种多样,常见的有一下几种情况。
主动删除: 在站点运营的时候,难免会出现一些内容,因为各种原因,需要进行删除的。
程序错误: 在站点更新的时候,程序出现了吗bug,导致部分资源的访问出现了问题,导致出现一些意料之外的死链。
网站改版: 网站改版尤其是设计到结构上的改版,对网址路径也做了变更的时候,会出现一些死链;所以,一定记得要做新旧内容地址的301跳转。
网站被黑: 网站被黑,时常会被生成大量的垃圾页面,站点修复后,这类页面就会产生大量的死链。

死链如何正确处理

网站出现大量死链,会影响站点在搜索引擎的站点评级,所以及时正确的处理死链,对于SEO优化至关重要。
首先要确保内容的页面的TCP/HTTP协议明确表示页面是死链,也就是页面必须返回404(未找到)、403(禁止访问)、503(服务不可用)等;推荐使用页面返回404状态码。
很多站点做到这一步就结束了,这是不可取的,一定要主动去对应搜索引擎的站长后台提交死链。如果仅仅依靠搜索引擎的日常抓取发现死链,处理周期会非常的常,甚至会有遗漏。
就会导致还是有大量的死链内容继续参与展现,带来不好的用户体验,尤其是链接数量较多的情况,必然会被站点SEO造成负面影响。

哪些死链需要提交

并不是所有的死链需要在搜索引擎提交死链,仅仅需要提交一些已经被搜索引擎收录的内容或者可能被收录的内容的链接,很多时候收录在抓取之后需要一定周期。
但是对于一些原本就搜索引擎无法抓取的内容,如有访问权限的内容,或者是刚创建并且没有推送给搜索引擎抓取的内容,就没有提交的必要。
在实际操作中,无法挨个排查收录的情况,所以普遍的做法就是将搜索引擎有访问权限,可能被抓取到的都提交死链。

如何发现死链

对于一些自主删除的内容,这部分死链是非常清晰没有问题的,但是一些潜藏的死链,显然是无法直接预知的。这就需要在站点后端添加统计,对于返回404等状态码的页面路径进行记录;或者是定期分析网站日志对异常访问记录进行筛选处理。但是一般来说我们会发现一些大量404页面,并且并不是正常的路径。
那首先可能是一些恶意访问,暴力枚举刷后台的,这种不归于死链;但是反之如果是非常规的路径但是访问成功了,那么就要仔细排查了,网站是否被有被攻击。
对于一些符合路径规则的404访问,那就需要具体分析,虽然符合路径也有可能是一些恶意访问。最终需要的是符合站点路径规则的404页面,尤其是搜索引擎访问报错的链接,注重分辨真假蜘蛛。
对于网站被黑生成的链接,可以通过排除正常路径,获得所有链接的集合,来作为死链提交。

如何提交死链

不同的搜索引擎的站长工具,死链提交的工具会有差异,但是大致都是支持单链接提交和文件提交方式,少量的死链使用单链接提交,数量较多的死链使用文件提交,下面潘某人SEO就和大家看看国内常见搜索引擎的死链提交工具。

百度搜索引擎

百度死链提交工具
如上图是百度搜索资源平台的死链提交工具,提供了快速死链和普通死链两种方式,死链提交之后,百度蜘蛛抓取后,死链抓取状态可在提交列表中查看,死链抓取后生效时间为1周,如超时未生效依然是收录状态,可以在反馈中心提交反馈。
快速死链: 死链规则30天内提交数量上限为100条,超出范围的数据暂时无法提交。已生效数据记录仅在列表中保留30天,列表中规则总数小于100条时可以提交新规则。但是实际可以提交多少取决于账户的提交额度,会有所不同。
百度死链文件提交
普通死链: 文件地址格式为txt或xml,每个地址文件最多包含50000个网址且需小于10MB;不支持索引型sitemap;文件中只可包含该网站主域下的网址。在提交的时候选择正确的更新周期,取决于站点提交的死链文件的更新周期。如果只是偶尔提交死链,一定把抓取周期填久点,并且如上图所示的死链处理状态状态显示已删除之后之后及时删除提交的该条死链文件,避免重复无效的抓取。

360搜索引擎

360死链提交
360搜索引擎同样支持,单链接和文件提交两种方式,不同的是两者的提交入口是不区分的、公用的,在同一个位置提交死链地址,或者是死链文件地址,有更新相关的字段,但是没有对更新周期的描述。
死链文件,格式为txt或xml。如死链文件超过12个,以文件格式提交。

搜狗搜索引擎

搜狗死链提交
搜狗搜索引擎,同样的支持单链接和文件提交方式。与百度和360搜索引擎不同的是搜狗搜索引擎支持规则提交。
文件提交支持xml格式和TXT格式两种格式文件。规则提交则是以斜杠/或问号?两种形式结尾的死链规则形式提交死链前缀,下面有详细解释。
搜狗搜索引擎单个站点每日提交死链限额为100w条url,若超过限额则返回“超出限额”状态。文件提交中每个文件最多可包含50000个网址,并且文件应小于10MB,文件总个数不超过100个。
规则提交,支持目录规则和CGI规则,目录规则:以“/”结尾的前缀、CGI规则:以“?”结尾的前缀。
分别表示删除一个目录或者CGI形式的通配链接,例如:https://www.chateach.com/seo/ 表示将seo目录之下所有的链接作为死链提交;https://www.chateach.com/seo? 则表示将满足seo?*所有的链接作为死链提交,*号是通配符可以代表任何内容。
这个规则提交功能还是非常棒的,一条规则可以搞定,特别适合整个目录删除或者网站被黑有大量同目录的死链的情况。
但是需要注意的是如果当前目录提交死链之后,在提交之后有新的死链,则需重新提交死链规则,并且必须在上次提交之后的30天后重新提交。
如果提交的新规则,被已提交的规则所包含,则会被忽略,同样的需要在30天后再提交,才能被处理。

总结一下,三者都支持单链接和文件提交,搜狗搜索引擎额外的还支持规则提交。只有百度和搜狗搜索引擎可以对死链文件更新抓取,其中百度搜索引擎可以设置更新周期,搜狗搜索引擎无法设置更新周期;360搜索引擎无更新抓取功能,提交属于一次性的。

死链提交方案

设想是能实现自动化提交死链,避免繁杂的定期提交,由于只有百度搜索引擎能够定期抓取死链文件,因此自动提交死链接也就适用于百度和搜狗搜索引擎,360搜索引擎死链文件只能手动提交了。

文件格式

三者都可以使用文件提交方式,直接使用txt文件方式提交,内行一条链接,不超过50000条,并且文件大小不超过10M。如果超过那就需要分次提交或者分割成多个文件提交。

如果站点的死链提交频次不高,那么直接全部使用手动提交,更加的简单,没有必要整自动提交。将站点所有的死链,生成txt文件,防止网站更目录,然后直接提交对应的访问地址即可,注重不能有任何的访问权限限制。

自动提交实现

如果站点经常性会有死链生成,那么就可以使用自动提交方式,但是需要成本两份文件,一个用于百度和搜狗搜索引擎的自动更新抓取,另一个用于手动提交其它搜索引擎;但是百度和搜狗的更新抓取周期并不一致,为了减少等待周期,可以分为不同的两个文件单独处理。

在网站根目录下定时更新死链文件,注意不是实时更新,而是按照一定条件触发更新,可以以静态文件的形式。更新触发条件为,监控当前死链文件路径地址,被搜索引擎抓取时则进行死链文件的更新。

每次更新的时候,将上次文件中的链接,在数据库中标记为已处理的链接。每次更新的死链文件中只包含未提交过的链接。为了提高效率,如果当后台有新死链接生成的时候而搜索引擎还未进行本周期的抓取,可以直接追加到当前死链文件中。

结合站点死链生成的周期,在百度搜索引擎死链提交工具中设置对应的更新周期。如此所有引擎会定期抓取死链文件,站点监控到抓取,则标记当前文件的中的死链为已处理,把待处理的死链更新到文件中,周而复始的自动提交死链了。

对于无法自动更新抓取的搜索引擎,则另外生成一份死链文件,可以把时间周期调长。对比也可以加上搜索监控,逻辑按上述自动提交的一致,在被360搜索引擎抓取之后,标记已有数据为已处理同时将待提交的死链更新到死链文件,然后手动提交到死链工具中,然后也能实现半自动。

从此你就告别了,每次死链提交时,思考要如何获取哪些链接作为死链提交,踏入了自动和半自动提交死链的时代!

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/1075tijiao
相关文章
  • 网站备案对于SEO优化有影响吗?

    网站备案,SEO优化,权威性

    ​网站备案的注意事项,关于网站未备案对于SEO优化排名是否有影响争议不断,有部分人始终认为网站备案和SEO之间没有任何的影响。网站进行ICP备案是提升网站权威性的因素中较为重要的一个。

    608
    • 网站备案
    • SEO优化
    • 权威性
  • 百度石榴算法打击什么行为

    石榴算法

    石榴算法是针对低质量网站的进一步打击的升级版,与之前百度绿萝算法相对应,这正是百度搜索引擎为了提高用户体验,提高入网安全性,提高搜索质量的有力手段。

    1448
    • 石榴算法
  • 域名价值评估

    域名价值评估

    大家知道一个域名的价值是由什么决定的呢?你知道如何判断一个域名的价值呢?对于SEOER们会从域名的权重角度来判断,但还是比较片面,我们应该从哪些方面更好判断一个域名的价值。

    712
    • 域名价值评估
  • 是什么在拉低阻碍站点的权重

    影响网站权重的因素

    分析下传统企业建站的站点有哪些问题是影响网站权重提升的因素。如果一个网站的结构上先天不足,那么对于后期优化真的是阻碍重重很折磨人......

    1976
    • 影响网站权重的因素
  • 跳出率对于网站排名的影响

    跳出率影响排名

    跳出率对于网站排名的影响,很多人认为网站跳出率高会影关键词排名,但是其实这是一种很荒谬的理论。要说跳出率影响排名,那么首先你得知道关键词排名的与跳出率之间存在哪些交集。

    1408
    • 跳出率影响排名
  • 百度索引量与收录量,两者有什么不同

    百度索引量,收录量

    在讲索引量和收录量的时候,就不得不反问下大家你真知道什么是收录吗?可以说大多数人对于收录的认知是错误,存在索引和收录概念混淆的情况。

    1144
    • 百度索引量
    • 收录量
  • 搜索引擎网页质量判定的标准

    搜索引擎,网页质量

    搜索引擎的根本是什么,是内容是对于用户搜索需求满足,这是搜索引擎最根本的逻辑,后续的一切也都是根据这个方向展开的。根据《百度搜索引擎网页质量白皮书》,站长们在百度搜索引擎优化中如何才能输出高质量内容呢?

    629
    • 搜索引擎
    • 网页质量
  • 网站SEO优化之关键词稀缺性

    SEO优化,关键词,稀缺性

    如果你的站点不管怎么优化,很大可能就是关键词选择有误,正确的关键词是SEO优化成功的关键。​SEO优化的目的是流量的获取,而网站的流量则是各个关键词流量的总和,同时流量的质量类中则则是由关键所决定,因此网站优化原则正确的关键词对于站点的优化效果以及转化效果至关重要。

    540
    • SEO优化
    • 关键词
    • 稀缺性
  • seo页面优化的常用技术

    seo页面优化的

    seo页面优化的常用技术,从核心关键词分析定位、网站目录和页面优化、标签优化技巧、利用好百度搜索资源平台、提高页面的附加价值、访客到客户的转化工作几个角度来讲下SEO页面优化的常用技术。

    1247
    • seo页面优化的
  • 收录数量和权重关系

    收录数量和权重关系

    收录数量和权重有什么关系呢,收录的数量越多是不是权重就越高,站点就有更大的流量呢?相信收录量是很多站点奋斗的目标,想方设法的去快速的增加大量的收录,但是最终并没有很好的效果,这是为什么呢?

    1114
    • 收录数量和权重关系
  • SEO优化中权重和栏目的关系

    SEO优化,权重优化

    你知道网站首页、栏目页、详情页之间是什么关系,对于权重又有什么影响呢?

    1303
    • SEO优化
    • 权重优化
  • wordpress建站怎么样,适合SEO优化吗

    wordpress建站

    wordpress建站是非常不错的,非常使用于新手,可以不写一句代码,快速的搭建属于自己的一个站点,并且wordpress拥有大量的模板插件,不但可以满足美观的展示效果,大量的插件支持也可以满足基本的SEO优化需求。

    1414
    • wordpress建站
  • 做seo优化排名赚钱吗?

    seo优化赚钱吗

    做seo优化排名赚钱吗?seo优化现在还好做吗?搜索引擎是个大市场,如果想在市场里买东西,就要打广告,所以seo优化不会过时,并且会是一个赚钱的行业。不论是以后做什么行业,我都觉得seo都是不可或缺的技术,因为任何行业都需要做广告推广,而seo则是经济实惠的选择。

    2045
    • seo优化赚钱吗
  • 长尾关键词

    关键词建设,长尾关键词

    什么是长尾关键词,不管网站权重高低,长尾词的建设在SEO优化中起着至关重要的作用,长尾关键词不仅可以提升目标关键词的排名,其次长尾关键词占据着更多的流量

    1875
    • 关键词建设
    • 长尾关键词
  • 百度原创星火计划是什么

    星火计划

    百度原创星火计划(又称伪原创的算法)是在,百度搜索团队首次表示,正在设计一套较完善的原创识别算法,并提出了互联网生态的项目课题,是为了解决原创内容的搜索排名问题。

    1513
    • 星火计划
  • TF-IDF技术在搜索引擎中的作用

    TF-IDF,搜索引擎

    TF-IDF技术在搜索引擎中的作用,事关如何更好的选择关键词,如何获得更好的排名的关键。掌握了解TF-IDF技术对于搜索引擎的作用可以让你更在SEO优化中更好如何筛选和优化关键词。

    580
    • TF-IDF
    • 搜索引擎
  • 巧用Robots避免蜘蛛黑洞

    Robots,蜘蛛黑洞

    搜索引擎的蜘蛛黑洞指的是搜索引擎蜘蛛在抓取站点内容的时候出现了大量雷同内容的url,导致搜索引擎蜘蛛一直被困在无限的循环中,如黑洞一般。直接的结果就会导致消耗大量的抓取资源。

    734
    • Robots
    • 蜘蛛黑洞
  • 一个简单的操作让你的网站安全立马上一个级别

    网站安全,防火墙

    对于SEO来说,网站安全是极为重要,因为网站被黑导致内容被串改成黑产,被搜索引擎降权K站的比比皆是,今天潘某人SEO教大家一个简单的操作就可以把网站的安全提升一个级别。快速检查下自己站点是否正确设置了,虽然不是万无一失,但还是非常有用的。平时还是应该定期排查,及时打补丁,免得追悔莫及!

    114
    • 网站安全
    • 防火墙
-- 这已经是底线了,看看别的把! --