首页 >  SEO >  SEO知识 >  正文

造成百度spider抓取异常的原因

 作者:潘某人SEO
134

有一些网页,内容优质,用户也可以正常访问,但是Baiduspider却无法正常访问并抓取,造成搜索结果覆盖率缺失,对百度搜索引擎对站点都是一种损失,百度把这种情况叫“抓取异常”。对于大量内容无法正常抓取的网站,百度搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、排序上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

下面向站长介绍一些常见的抓取异常原因:

1、服务器连接异常

服务器连接异常会有两种情况:一种是站点不稳定,Baiduspider尝试连接您网站的服务器时出现暂时无法连接的情况;一种是Baiduspider一直无法连接上您网站的服务器。
造成服务器连接异常的原因通常是您的网站服务器过大,超负荷运转。也有可能是您的网站运行不正常,请检查网站的web服务器(如apache、iis)是否安装且正常运行,并使用浏览器检查主要页面能否正常访问。您的网站和主机还可能阻止了Baiduspider的访问,您需要检查网站和主机的防火墙。

###2、网络运营商异常
网络运营商分电信和联通两种,Baiduspider通过电信或网通无法访问您的网站。如果出现这种情况,您需要与网络服务运营商进行联系,或者购买拥有双线服务的空间或者购买cdn服务。
抓取异常的原因

3、DNS异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

4、IP封禁

IP封禁为:限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,在这里特指封禁了BaiduspiderIP。当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,请检查相关设置中是否误添加了BaiduspiderIP。也有可能是您网站所在的空间服务商把百度IP进行了封禁,这时您需要联系服务商更改设置。

5、UA封禁

UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA封禁。当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,useragent相关的设置中是否有Baiduspider UA,并及时修改。

6、死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
对于死链,我们建议站点使用协议死链,并通过百度站长平台–死链工具向百度提交,以便百度更快地发现死链,减少死链对用户以及搜索引擎造成的负面影响。

7、异常跳转

将网络请求重新指向其他位置即为跳转。异常跳转指的是以下几种情况:
1)当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或者首页,百度建议站长将该无效页面的入口超链接删除掉
2)跳转到出错或者无效页面
注意:对于长时间跳转到其他域名的情况,如网站更换域名,百度建议使用301跳转协议进行设置。

8、其他异常:

1)针对百度refer的异常:网页针对来自百度的refer返回不同于正常内容的行为。
2)针对百度ua的异常:网页对百度UA返回不同于页面原内容的行为。
3)JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。
4)压力过大引起的偶然封禁:百度会根据站点的规模、访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样Baiduspider会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。

公众号
潘某人SEO 关注我每天学习SEO优化相关知识... 485篇原创内容
潘某SEO 公众号
申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于CC0协议或已获得VRF授权的图库站点 本文参考于互联网如有侵权,请联系 pmrseo@foxmail.com删除 本文地址:https://www.chateach.com/seo/seozhishi/1060spider
相关文章
  • 大多数站长搞错了SEO的核心

    SEO的核心,seo优化

    大家觉得SEO优化的核心重点是什么呢?关键词排名展现,如果您是这么认为的那请看完这篇文章,你会有不同的感悟。SEO的核心并不是在于关键词的排名,关键的排名只是途径。

    388
    • SEO的核心
    • seo优化
  • 如何批量查询收录

    网站收录批量查询,收录查询代码

    介绍一个可以自制的批量快速查询网站收录情况的工具,只需要简单的几行代码,就可以实现批量查询,从此不必一条条去手动查询收录,或者依靠第三方工具了。

    1138
    • 网站收录批量查询
    • 收录查询代码
  • 网站SEO过度优化的危害

    SEO过度优化

    过度的SEO优化是很多站点都存在的问题,现在很多站点的SEO优化已经是病态的,一天到晚执着了页面结构、关键词布局、内链、外链、友链以及一些技术手法,而忽视了最关键词的内容的优化

    1026
    • SEO过度优化
  • 百度信风算法

    百度信风算法,翻页诱导

    百度信风算法是打击翻页诱行为的算法, 是为了防止站点通过利用翻页进行诱导,从而保护用户的浏览体验。

    1730
    • 百度信风算法
    • 翻页诱导
  • 如何防止网站内容被采集保护原创

    防爬取,原创保护,防采集

    分享一个值得一看的保护内容被恶意抓取采集的方案,如何更高效率的从源头解决网站内容被采集,保护站点原创收录排名。

    1504
    • 防爬取
    • 原创保护
    • 防采集
  • 内容模块之间为何要设置合理间隔

    页面为何要设置合理间隔

    内容模块之间为何要设置合理间隔,主体内容应与广告、相关推荐等次要内容板块之间有明显间隔距离或分割线,使用户获取信息时不受任何干扰。”本文将为你详细讲解如何设置合理间隔更符合用户浏览页面信息的需要。

    1308
    • 页面为何要设置合理间隔
  • seo标题写法及其重要性

    seo标题写法,重要性

    标题对于SEO优化起着一个什么样的作用呢,这是一个值得思考的问题。很多人认为一个好的标题对于排名有着很好的作用,但是个人不这么认为,标题的作用没有我们想象的那么重要!

    1262
    • seo标题写法
    • 重要性
  • 链接权重分析HITS算法的不足之处

    HITS算法的不足之处,链接权重分析

    搜索引擎链接权重分析,主要参考。HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。HITS算法的不足之处,引用越多高质量页面的网页,其链接权威度越高。

    1936
    • HITS算法的不足之处
    • 链接权重分析
  • 通过时效性内容提高网站收录速度

    时效性内容收录

    通过时效性内容提高网站收录速度是一个不错的方法,但是你知道如何保护自己的原创内容不被别人抄袭还比你更快收录吗?一种提高内容收录及更新抓取速度的方法。

    1457
    • 时效性内容收录
  • SEO优化中权重和栏目的关系

    SEO优化,权重优化

    你知道网站首页、栏目页、详情页之间是什么关系,对于权重又有什么影响呢?

    1123
    • SEO优化
    • 权重优化
  • 新站排名不稳定的原因

    新站排名不稳定

    新站排名不稳定的原因,新站排名不稳定最基础的原因有两个,一是搜索引擎更新算法引起的影响,其实搜索引擎更新算法,不仅影响新站,老站也会被波及到。二是,新站本身权重都很低,搜索引擎对新站有一个观察前,前期信任度低。

    1691
    • 新站排名不稳定
  • 移动端适配解决方案

    移动端适配

    随着移动互联网的不断发展,在某些领域移动端的流量已经远超PC端,因此越来越多的站点开始重视移动端的优化,如何把移动端和PC端进行结合,对于SEO优化是一个非常重要的问题。移动适配的方案有很多,选择合适的移动适配解决方案是非常的重要的。

    709
    • 移动端适配
  • SEO如何选择域名,你选对了吗?

    域名,网站优化

    域名的选择主要是从站点的运营和SEO优化两个层面考虑,那你觉得哪个因素更加重要呢,可以心里默选一下,答案稍后揭晓。域名选择最基础的点:历史干净、便于记忆。

    380
    • 域名
    • 网站优化
  • 友情链接交换规则

    友情链接

    友情链接本质上就是外链,但是与外链不同它是双向的,两站点互相导出;那么在友情链接交换中我们需要注意什么呢?

    1047
    • 友情链接
  • 外链对SEO优化的影响

    外链SEO优化

    SEO优化中核心的一个过程就是发外链,不论是过去还是现在,外链都是一个备受争议的话题,有人说外链对SEO优化没有什么用了,而有的人又对做外链情有独钟。那么外链到底还有没有用,我们在发布外链的时候该注意什么,怎样才能获得优质的外链呢。

    1092
    • 外链SEO优化
  • 百度冰桶算法,移动页用户体验保护

    百度冰桶算法

    百度一直都在打击移动端用户体验不好的网站,从app的强制下载到现在的广告位置布局,冰桶算法是专门为了移动端体验效果而生的算法,为了提高移动端的用户体验效果

    2292
    • 百度冰桶算法
  • 网站标题千万不要乱写,否则你要面临什么?

    网站标题,备案

    网站标题对于一个网站运营及seo都是非常的重要的,一般会在网站标题中凸显公司名称或者是品牌词,但是如果前期没好足够规范,那可能后果会超出你的承受范围,就单seo层面,优化了很久的品牌词面临要去除的情况,是不是非常令人难以接受。

    15
    • 网站标题
    • 备案
  • 关于索引量,你必须知道的事

    百度索引量

    网站被Baiduspider抓取收录后,经过一系列计划才得以建入索引库,有了和搜索用户见面的机会。所以,索引量一直是站长们关注的焦点,但我们发现,依然有很多站长对索引量存在误读。

    1613
    • 百度索引量
-- 这已经是底线了,看看别的把! --