首页 >  SEO >  SEO知识 >  正文

巧用Robots避免蜘蛛黑洞

 作者:潘某人SEO
625

搜索引擎的蜘蛛黑洞指的是搜索引擎蜘蛛在抓取站点内容的时候出现了大量雷同内容的url,导致搜索引擎蜘蛛一直被困在无限的循环中,如黑洞一般。直接的结果就会导致消耗大量的抓取资源。

​对于站点来说,每天的抓取额度是有限的,尤其是对于抓取量偏低的站点,则应该更要重视蜘蛛黑洞的出现,要实现高质量内容的优先抓取。长期的蜘蛛黑洞对于站点的收录是非常不利的,轻则影响站点的收录,重则会导致搜索引擎引擎因为有价值内容抓取不到而调低抓取频次。

常见的蜘蛛黑洞

蜘蛛黑洞的主要特征,页面内容相似,或者蜘蛛抓取页面链接会继续进入相类似页面。通常出现在页面的搜索或者筛选页面。

搜索页面当搜索词相近的时候页面的内容是高度重复,而对于站点是无法控制用户不去搜索相似关键词。另外很多站点会有筛选的功能,比如列表页存在通过筛选条件去对页面内容进行筛选,这种情况是最糟糕的,页面内容是在相同的内容中取出不过相同结果的内容,并且url是相同的只是参数不一样。

# 举例有一个列表页面的链接是,内容是seo相关的
https://www.chateach.com/seo
# 当用户筛选,seo相关的算法
https://www.chateach.com/seo?type=seo算法
1
2
3
4

如上所示的,不管是搜索页面还是页面的筛选,对于相同的页面进行结果的筛选的时候本质上是同一个地址,只是后面的参数不同 ,而对于搜索引擎url带有不同的参数也是作为不同的url内容来抓去对待的。如果当这类页面足够多,搜索引擎便会抓取大量此类页面,抓取获得的内容基本都是相似的。

如何避免蜘蛛黑洞

解决蜘蛛黑洞问题很简单,只需要在robots.txt文件中配置,禁止抓取带有参数的页面就可以实现了,但在实际中部分的带有参数页面也是存在一定价值的,但是这个就需要人工去筛选处理下。

# 屏蔽所有搜索引擎对于动态页面的抓取
User-agent: *
Disallow: /*?*
1
2
3

robots更新
对于排除对于这部分动态参数页面的屏蔽,但我更推荐还是屏蔽所有动态参数页面,将有价值的页面人工筛选之后生成独立的页面,如果可以将有价值的搜索结果页面作为tag页面去实现,这个可以根据自己站点情况灵活处理。

配置好robots文件之后,一般需要等待1周左右的时间生效,对于百度搜索引擎,可以进入站长搜索资源平台刚更新robots加速​规则的生效。

申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于站点原创或CC0协议图库站点或已获得VRF授权的图库站点 版权申明:本文为博主原创,未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本文地址:https://www.chateach.com/seo/seozhishi/975robots
相关文章
  • robots文件有什么用

    robots有什么作用

    robots文件作用对于SEO优化不可忽视给i,可以有效提高网站内容的质量减少重复收录,保护隐私数据不被抓取!

    1520
    • robots有什么作用
  • robots文件里该不该加上sitemap地址

    robots里放sitemap

    robots文件里该不该加上sitemap地址,有种说法就是搜索引擎抓取一个网站首先会抓取robots文件,这样把sitemap地址写在robots文件里,这样搜索引擎可以地址直接的对网站地图进行抓取,可以加快链接收录的速度,真相并不是这样

    2037
    • robots里放sitemap
  • 巧用robots避免蜘蛛黑洞

    robots,蜘蛛黑洞

    今天我们来了解下什么是蜘蛛黑洞,黑洞大家应该有一定的了解,属于一种高质量高引力天体,包括光任何的物体都无法逃逸。蜘蛛黑洞既是蜘蛛进入之后无法再出来,对正常的抓取工作产生负面影响。

    1188
    • robots
    • 蜘蛛黑洞
  • SEO优化必须掌握的robots文件协议

    robots,SEO优化

    robots文件使用来申明网站哪些内容允许搜索引擎抓取,哪些内容禁止搜索引抓取的;正确的设置robots可以提升搜索引擎对网站的抓取效率,同时避免不必要的内容被抓取展现。但在实际运用中很多站点没有正确的使用robots导致了一些问题,今天潘某人SEO就为大家揭秘下robots的注意点。

    705
    • robots
    • SEO优化
  • robots协议不生效怎么处理

    robots

    为什么明明已经设正确设置的robots的屏蔽规则,但是就是不生效导致不该收录的内容被收录了呢?

    507
    • robots
  • 如何屏蔽某些页面的抓取,但是让页面中链接正常抓取

    meta标签屏蔽页面抓取

    如何屏蔽某些页面的抓取,但是让页面中链接正常抓取,对于这种情况,使用meta标签来进行屏蔽页面的抓取,可以变得更加的有效。相比常用的robots文件屏蔽,或者nofollow标签屏蔽的实用性更加的广。

    2990
    • meta标签屏蔽页面抓取
  • 百度惊雷算法3.0解读

    惊雷算法,百度算法

    百度惊雷算法3.0解读,对违规行为较严重的领域(如:汽车、下载、招聘、B2B、网站SEO等)进行了针对性的打击。

    1533
    • 惊雷算法
    • 百度算法
  • 子目录与二级域名,哪个更利于SEO!

    二级目录排名,子目录,二级域名

    当你网站内容需要扩展的时候你会选择二级域名还是子目录的方式呢?采用哪种方法对于SEO优化的效果更好呢?

    958
    • 二级目录排名
    • 子目录
    • 二级域名
  • 为什么网站关键词排名在第二页上去不

    排名怎么计算的,排名提升的原理,第二页的关键词如何提升排名

    为什么网站关键词排名在第二页上去不,这种情况一般是网站内容质量度不够,那么后续的SEO优化方向就要去提升站点的内容质量。揭秘排名计算的方式

    1933
    • 排名怎么计算的
    • 排名提升的原理
    • 第二页的关键词如何提升排名
  • 百度搜索引擎Spider抓取系统的基本框架

    搜索引擎,百度spider

    互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做“spider”。例如我们常用的几家通用搜索引擎蜘蛛被称为:Baiduspdier、Googlebot、Sogou Web Spider等。

    287
    • 搜索引擎
    • 百度spider
  • 网站SEO优化监控哪些指标

    SEO优化效果,SEO指标

    数据是进行网站建设的重要参考依据,任何网站的建立都不是凭空幻想出来的。标题的撰写、导航的确立以及内容的编辑都是依靠数据而进行,数据对于我们seo后期的工作更具指导作用。那么网站的哪些数据是优化人员需要关注的呢?

    727
    • SEO优化效果
    • SEO指标
  • SEO优化权重的错误认知

    SEO优化,权重

    如果你觉得权重就是seo优化的衡量标准,那么一定要看完这篇文章。相信对你肯定会有帮助,首先公布结论,权重作为SEO效果的衡量标准,只能作为参考,并且参考意义的大小还要根据实际情况分析。

    709
    • SEO优化
    • 权重
  • 图片懒加载对于SEO优化有影响吗?

    懒加载,延迟加载,seo优化

    网站图片使用懒加载也就是延迟加载技术,对于SEO优化会有不良的负面影响吗?对于图片的延迟加载我们应该如何去看待处理,才能做到兼顾网站的加载速度以及SEO优化的效果呢?

    1610
    • 懒加载
    • 延迟加载
    • seo优化
  • 跳出率对于网站排名的影响

    跳出率影响排名

    跳出率对于网站排名的影响,很多人认为网站跳出率高会影关键词排名,但是其实这是一种很荒谬的理论。要说跳出率影响排名,那么首先你得知道关键词排名的与跳出率之间存在哪些交集。

    1348
    • 跳出率影响排名
  • 网站使用CDN会对SEO有什么好处

    CDN,SEO优化

    CDN 是构建在数据网络上的一种分布式的内容分发网,网站使用CDN会对SEO有什么好处,如何正确的使用cdn才能发挥对于seo优化的作用。

    814
    • CDN
    • SEO优化
  • 稀缺性内容快速提升站点收录

    稀缺性内容,站点收录

    很多站点面临的内容收录少并且收录周期长的问题,网站收录少收录慢的快速进来围观,今日分享一个可以快速提升站点收录量及收录速度的方法。

    396
    • 稀缺性内容
    • 站点收录
  • 为什么网站有收录却没有流量?

    收录,流量

    相信很多人对于网站有收录但是却没有流量,甚至一些站点的整体收录不错,但是网站的流量却依然很差,今天潘某人SEO为您来揭秘其中的缘由!

    264
    • 收录
    • 流量
  • seo的主要策略和流程内容

    整站优化策略

    整站优化策略、介绍seo的主要策略和流程内容。对一个网站进行综合的优化,包括了域名选择、网站结构或栏目设置、内部及外部链接,内容建设,访问者体验等多个方面进行的优化。

    1955
    • 整站优化策略
-- 这已经是底线了,看看别的把! --