首页 >  SEO >  SEO知识 >  正文

造成百度spider抓取异常的原因

 作者:潘某人SEO
251

有一些网页,内容优质,用户也可以正常访问,但是Baiduspider却无法正常访问并抓取,造成搜索结果覆盖率缺失,对百度搜索引擎对站点都是一种损失,百度把这种情况叫“抓取异常”。对于大量内容无法正常抓取的网站,百度搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、排序上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

下面向站长介绍一些常见的抓取异常原因:

1、服务器连接异常

服务器连接异常会有两种情况:一种是站点不稳定,Baiduspider尝试连接您网站的服务器时出现暂时无法连接的情况;一种是Baiduspider一直无法连接上您网站的服务器。
造成服务器连接异常的原因通常是您的网站服务器过大,超负荷运转。也有可能是您的网站运行不正常,请检查网站的web服务器(如apache、iis)是否安装且正常运行,并使用浏览器检查主要页面能否正常访问。您的网站和主机还可能阻止了Baiduspider的访问,您需要检查网站和主机的防火墙。

###2、网络运营商异常
网络运营商分电信和联通两种,Baiduspider通过电信或网通无法访问您的网站。如果出现这种情况,您需要与网络服务运营商进行联系,或者购买拥有双线服务的空间或者购买cdn服务。
抓取异常的原因

3、DNS异常

当Baiduspider无法解析您网站的IP时,会出现DNS异常。可能是您的网站IP地址错误,或者域名服务商把Baiduspider封禁。请使用WHOIS或者host查询自己网站IP地址是否正确且可解析,如果不正确或无法解析,请与域名注册商联系,更新您的IP地址。

4、IP封禁

IP封禁为:限制网络的出口IP地址,禁止该IP段的使用者进行内容访问,在这里特指封禁了BaiduspiderIP。当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,请检查相关设置中是否误添加了BaiduspiderIP。也有可能是您网站所在的空间服务商把百度IP进行了封禁,这时您需要联系服务商更改设置。

5、UA封禁

UA即为用户代理(User-Agent),服务器通过UA识别访问者的身份。当网站针对指定UA的访问,返回异常页面(如403,500)或跳转到其他页面的情况,即为UA封禁。当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,useragent相关的设置中是否有Baiduspider UA,并及时修改。

6、死链

页面已经无效,无法对用户提供任何有价值信息的页面就是死链接,包括协议死链和内容死链两种形式:
协议死链:页面的TCP协议状态/HTTP协议状态明确表示的死链,常见的如404、403、503状态等。
内容死链:服务器返回状态是正常的,但内容已经变更为不存在、已删除或需要权限等与原内容无关的信息页面。
对于死链,我们建议站点使用协议死链,并通过百度站长平台–死链工具向百度提交,以便百度更快地发现死链,减少死链对用户以及搜索引擎造成的负面影响。

7、异常跳转

将网络请求重新指向其他位置即为跳转。异常跳转指的是以下几种情况:
1)当前该页面为无效页面(内容已删除、死链等),直接跳转到前一目录或者首页,百度建议站长将该无效页面的入口超链接删除掉
2)跳转到出错或者无效页面
注意:对于长时间跳转到其他域名的情况,如网站更换域名,百度建议使用301跳转协议进行设置。

8、其他异常:

1)针对百度refer的异常:网页针对来自百度的refer返回不同于正常内容的行为。
2)针对百度ua的异常:网页对百度UA返回不同于页面原内容的行为。
3)JS跳转异常:网页加载了百度无法识别的JS跳转代码,使得用户通过搜索结果进入页面后发生了跳转的情况。
4)压力过大引起的偶然封禁:百度会根据站点的规模、访问量等信息,自动设定一个合理的抓取压力。但是在异常情况下,如压力控制失常时,服务器会根据自身负荷进行保护性的偶然封禁。这种情况下,请在返回码中返回503(其含义是“Service Unavailable”),这样Baiduspider会过段时间再来尝试抓取这个链接,如果网站已空闲,则会被成功抓取。

申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于站点原创或CC0协议图库站点或已获得VRF授权的图库站点 本文参考于互联网如有侵权,请联系 pmrseo@foxmail.com删除 本文地址:https://www.chateach.com/seo/seozhishi/1060spider
相关文章
  • 站长SEO新手必看,SEO思想分享

    SEO,站长

    SEO是文学、科技、哲学、数学等共同作用的产物。大家有没有想过按照了所谓的白皮书完全按照规范去优化,但是永远都是不叫效果。

    757
    • SEO
    • 站长
  • 被k网站的症状,恢复需要多久,如何操作呢?

    被k网站恢复,降权

    网站被K也是常有的事情,一夜之间前功尽弃的站点屡见不鲜,那么网站被K之后如何处理才能尽快的恢复,站点又如何预防K站的情况发生呢!

    691
    • 被k网站恢复
    • 降权
  • 怎么增加站长工具关键词库

    站长关键词库

    了解了什么是关键词库,接下来就要了解到关键词的意义了。关键词库和网站的权重是息息相关的,大家可以看一下网站权重的计算方法就明白了。简单的讲权重是根据预估流量来划分的,而预估流量就是来源于关键词库中的关键词的排名所决定的。

    877
    • 站长关键词库
  • 如何正确理解SEO关键词

    SEO关键词

    关键词作为SEO优化的核心点,作为一个合格的SEOER对于关键词有一个正确的认识是非常的重要的,对于关键词的认知有多深,决定了在SEO优化这条路上可以走多远。

    639
    • SEO关键词
  • 稀缺性内容快速提升站点收录

    稀缺性内容,站点收录

    很多站点面临的内容收录少并且收录周期长的问题,网站收录少收录慢的快速进来围观,今日分享一个可以快速提升站点收录量及收录速度的方法。

    395
    • 稀缺性内容
    • 站点收录
  • 你分享的链接泄露隐私了吗?

    跟踪链接,隐私

    今天这个话题看似和SEO没啥关系,那就耐心看到最后就有了,先回归正题大家有没有意识到自己平时分享的链接会泄漏隐私吗?大家平时是不是会分享一些歌曲、一些短视频的链接及各种社交app应用的链接给微信好友或者是分享到朋友圈,当然分享到其它地方也是如此,只要你分享了这些链接你都将面临有隐私泄漏的可能。

    723
    • 跟踪链接
    • 隐私
  • 网站seo首页标题怎么写

    seo首页标题

    标题是一篇文章的核心,是对于全片内容的一个简明扼要的概括,同样一个网站的首页的标题是整个网站的一个门面,代表着整个网站的内容及属性。那么网站的标题应该如何写,又该考虑哪些因素呢?

    964
    • seo首页标题
  • SEO内部链接的重要性

    seo内链

    很多站点会关注外链的优化而忽略了内链的优化,但是对于目前的环境来说外链的效果有效,优质外链获得的成本是比较高的,过多的垃圾外链是弊大于利。相比之下内链的的优化空间是非常大的,而且基本不受限制,做好站点的内链优化对于seo优化的意义是非常大的。

    782
    • seo内链
  • 域名后缀对seo的影响

    域名后缀SEO影响

    域名后缀以及域名的长短会对网站seo产生影响吗?早期来说域名的后缀对于SEO优化不会有任何的影响,但是随着这个行业的发展慢慢的出现了群站,如今是否存在影响也是成为了一个不确定的因素。

    2081
    • 域名后缀SEO影响
  • 如何识别百度蜘蛛

    百度蜘蛛辨别

    如何识别百度蜘蛛,百度蜘蛛对于站长来说可谓上宾,可是我们曾经遇到站长这样提问:我们如何判断疯狂抓我们网站内容的蜘蛛是不是百度的?

    1179
    • 百度蜘蛛辨别
  • 内容采集对于网站优化有什么影响

    采集对于排名影响

    内容采集、伪原创、抄袭等操作方式对于网站排名会不会有影响;凡事都有两面性,重点在于我们找到里面的平衡点,对于seo优化来说采集伪原创的方式并不是不可以使用,关键在于掌握其中的奥秘.....

    1125
    • 采集对于排名影响
  • 新网站如何快速提升排名

    如何快速提升排名,新网站SEO优化

    新网站如何SEO优化快速提升排名,需定时更新内容,保证更新内容的质量,内容不仅要做到 原创,更要注重内容的价值,把握SEO优化的核心是什么,不能为了排名而去优化网站,舍本逐末。

    1361
    • 如何快速提升排名
    • 新网站SEO优化
  • SimHash算法,关键词堆砌打击

    SimHash算法

    Simhash算法又被SEO站长们成为关键词匹配算法,当用户搜索一个关键词的时候,会出现相关的网站进行展现,但是前些年有个别站长发现关键词密度越高排名越好,这是搜索引擎前期的漏洞,Simhash算法(也成分词匹配算法)对关键词堆砌起到了决定性的打击,

    2712
    • SimHash算法
  • 百度抓取频次忽然下降的原因有哪些?

    抓取频次降低的原因

    百度抓取频次忽然下降的原因有哪些?网站抓取频率不知道作为seoer的大家是否有时常的关注,可以说检查我们的网站是否健康,网站的健康程度,关注这些网站上的日常数据也是seo的工作之一,当然看到有一些小伙伴们问道说, 自己的网站突然遇到了网站抓取频率下降这是为什么?

    6737
    • 抓取频次降低的原因
  • SEO内容优化劣迹行为你有吗

    SEO内容优化

    不管你的站点是否需要SEO优化,都需要的是优质的内容,得用户者得流量。而在实际的运行中却十分不理想,普遍的存在着垃圾制造的行为。

    654
    • SEO内容优化
  • seo网站页面性能优化指南

    seo,页面性能

    seo优化站点必须做的事情,提升网站的加载速度性能。为了更好地提升用户的浏览体验,《移动落地页体验白皮书5.0》中规定:页面的首屏内容应在1秒内加载完成。

    940
    • seo
    • 页面性能
  • 如何做好原创内容版权保护

    版权保护,原创内容保护,百度时间因子

    分享如何对站点原创内容的保护,如何查找抄袭站点,如何保留抄袭证据等方法,来保护自己的合法权益。

    1006
    • 版权保护
    • 原创内容保护
    • 百度时间因子
  • 下载站注意,清风算法4.0来了

    清风算法4.0,SEO算法,下载站

    如果你的站点是下载站,那么请一定进来看下百度清风算法4.0版本,2021-09-02百度搜索资源平台发布公告对清风算法进行升级,进入了4.0版本。本次清风算法升级加大了针对不符合规范的低质下载站,将限制其在百度搜索结果中的展现。

    1213
    • 清风算法4.0
    • SEO算法
    • 下载站
-- 这已经是底线了,看看别的把! --