网站运营之中死链的出现是无法避免的,但如果无法及时发现并正确处理势必对于网站的SEO优化产生一定的影响。那么我们应该如何及时发现死链,如何及时处理呢?
什么是死链
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等,通常使用404状态码。
内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
简而言之,当站点的内容不需要之时进行了删除操作,导致原先可以访问的内容变为了不存在。而对于不存在的地址被访问的时候,需要返回404状态码。
死链对于SEO的危害
首先如果存在大量的死链会导致访问流量的流失,但这个也不是很重要,既然已经删除此页面之时已经注定无法从此链接获得流量。但是在搜索引擎出现大量死链会直接导致用户体验不佳,长期以往会影响站点在搜索引擎的评级,从而影响到站点的排名。
对于抓取效率产生影响,搜索引擎对于站点的抓取频次是根据站点的质量给到一定额度,而这些内容抓取包含了新内容的抓取和已抓取过内容的定期抓取。如果其中混入了大量的死链,那么就会导致正常内容被抓取的数量降低,从而导致内容收录或更新产生影响。
SEO死链如何处理
如果死链已经正确的设置了404状态码,那么搜索引擎抓取到了也会自动的删除索引,但是不推荐这种方法,原因如上如果大量的死链会对SEO产生负面影响。
正确的方式是去各个搜索引擎的站长后台提交死链接。可以最快最有效的让搜索引擎对于全部的死链进行一次性的抓取,然后等待其生效即可。
这里有个误区需要提醒下,很多站长认为死链的提交只要提交已经收录的内容,这种观点是错误的。内容没有收录只能说没有建立索引,但是只要内容被抓取过,就有可能过段时间进入索引,这是站点无法确认的。退一步,如果说每条死链的提交都要去查询收录状态,显然是低效的不切实际的。
如何发现死链
死链的出现有两种情况,一种是站点主动删除内容导致出现的死链,还有一种则是网站出现了未知错误导致的死链。对于第二种情况的死链,我们是无法直接知晓的。
首先内容删除的时候不要直接进行物理删除,而是进行逻辑删除,方便知晓所有删除内容的url地址。同时对于未知导致的死链可以通过添加日志统计的方式来确认,可以记录每一次404状态码被触发的url地址,只要死链被访问,就可以第一时间知晓。但是如果网站日志或者统计中有大量的死链出现莫慌,需要进行进一步分析,不排除是攻击流量,这类404页面就无须进行处理。
死链的提交方式
不同的搜索引擎死链的提交方式可能存在差异,但是无非是两种模式。一种是直接提交链接,还有一种是文件提交。
文件提交类似于sitemap的txt或xml文件提交方式,将所有需要提交死链放入一个txt文件中,每条链接为一行。然后将txt文件放置到网站根目录,确保搜索引擎可以正常访问到此txt文件的url地址。
如图是百度搜索资源平台的死链提交例示,支持的文件提交的方式,初始额度是5指的是可以提交5个死链的文件地址,每个文件支持5万条链接,足够多数站点使用了,死链文件提交时候可以选择更新周期,更新周期则是站点提交的死链文件中死链地址更新的周期,这样一来就可以实现通过提交一个死链地址,当出现新死链地址的时候直接更新此文件而无需重新提交,对于死链文件被抓取之后,原先死链文件中的死链地址可以进行覆盖,无需长期保留。
死链的避免
比起提交死链的操作,更应该避免大量死链的出现。首先要严防网站bug的出现导致死链的出现,其次在运行中要尽可能的避免大量的删除内容。
但是如果遇到不得不需要大量删除内容的时候,一定要分批删除提交死链,删除旧内容的同时补充一定数量的新内容,保证内容的总数的稳定上升,绝不可以出现大幅度下降,尤其站点原本的内容就很单薄的站点。如果非要如此,不如重新再搞一个站点。