首页 >  SEO >  SEO知识 >  正文

巧用robots避免蜘蛛黑洞

 作者:潘某人SEO
1109

今天我们来了解下什么是蜘蛛黑洞,黑洞大家应该有一定的了解,属于一种高质量高引力天体,包括光任何的物体都无法逃逸。蜘蛛黑洞既是蜘蛛进入之后无法再出来,对正常的抓取工作产生负面影响。

造成蜘蛛黑洞的原因

有些站点含有大量的重复页面,常见的如站点的内容雷同,但具体参数不同的动态URL ;就会导致蜘蛛抓取大量相似或者相同的内容,导致有限的抓取频次被消耗殆尽,一定程度上影响了有价值页面的及时收录。

巧用robots避免蜘蛛黑洞

重复内容其实很难避免,比如有的站点内容页面有筛选功能,通过不同的条件去筛选显示对应的内容,常用的技术有点就是根据条件通过ajax查询反馈结果到当前页面,就会导致不同的查询结果,出现同一个链接带不同参数的url出现。最终就导致展现有大量的带参数的重复url被收录。不仅仅会影响搜索引擎的抓取,站点出现大量的相似内容也会对网站的评级产生影响。

屏蔽动态链接

对于这类情况处理还是很简单的,就是屏蔽所有动态链接的抓取,通过robots.txt文件规则来实现。在robots文件中添加Disallow: /*?* ,即禁止搜索引擎访问网站中所有的动态页面。这样就可以简单高效的屏蔽了低质量页面的抓取,有效的避免了蜘蛛黑洞的出现。

但是有的时候某些站点的动态页面是有价值的,是需要被收录的,直接屏蔽所有动态页面的抓取是不合理的;可以在Disallow: /*?* 的下一行添加允许抓取的动态链接,比如站点"/seodd"目录下的动态链接允许抓取,那么就是添加一行 allow: /seodd/*?* 。如果需要放通的比需要屏蔽的更多,就可以一个个目录屏蔽,而不是屏蔽所有目录再去放通某个目录。

公众号
潘某人SEO 关注我每天学习SEO优化相关知识... 485篇原创内容
潘某SEO 公众号
申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于CC0协议或已获得VRF授权的图库站点 版权申明:本文为博主原创,未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本文地址:https://www.chateach.com/seo/seozhishi/691
相关文章
  • 是什么在拉低阻碍站点的权重

    影响网站权重的因素

    分析下传统企业建站的站点有哪些问题是影响网站权重提升的因素。如果一个网站的结构上先天不足,那么对于后期优化真的是阻碍重重很折磨人......

    1765
    • 影响网站权重的因素
  • SEO优化之外链

    外链优化,绿萝算法

    SEO外链优化,买卖链接不可取,迟早要被打击,目光放远的,多提升站点内容质量,外链在于精,不在于多。切记不要舍本逐末。

    1504
    • 外链优化
    • 绿萝算法
  • 索引量和收录量的区别

    关系区别,收录量,索引量

    索引量和收录量的很容易混淆认清两者的关系对于网站优化十分的有帮助,分析索引量和收录量的数据可以及时的发现网站的问题。

    2070
    • 关系区别
    • 收录量
    • 索引量
  • SEO前景如何,能干一辈子吗?

    SEO前景

    是SEO走向落寞了吗?​现在越来越多的人开始选择放弃seo,而去选择短视频新媒体等推广引流方式,不知大家如何看待这一现象呢?今天潘某人SEO来分享下对于SEO发现前景的看法,希望对你有帮助!

    979
    • SEO前景
  • 移动端适配的几种实现方式

    移动端适配

    移动端适配的几种实现方式,rem布局、flex布局、百分比布局、字体适配、vm布局。纯CSS的相对单位vw,vh,它们相对的是终端视口,视口(移动端你就可以当成屏幕就好啦)的宽为100vw,高为100vh。使用起来很简单

    14059
    • 移动端适配
  • 百度快照与权重的关系

    权重,百度快照

    百度快照与权重的关系,事实上百度快照并不能反映出搜索引擎蜘蛛抓取网站数据的时间,更不能决定页面的权重。所以大家不必过度的关注百度快照

    1254
    • 权重
    • 百度快照
  • seo优化自学难吗?

    seo自学

    seo优化自学难吗?不少人想进入SEO这个行业,由于个人原因无法去参加培训,想自学SEO,​对于自学SEO优化,这个问题,如果实在没有办法,在网上有很多实战教程,但是还是建议多看相关的书籍比网上学习更好。

    1008
    • seo自学
  • seo优化是什么意思?

    seo优化

    什么是SEO优化,SEO(Search Engine Optimization)搜索引擎优化,通过利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名,是一种不消耗额外广告费的一种推广手。

    672
    • seo优化
  • site结果和网站权重有什么关系

    site命令,首页降权

    site域名不在首页就是网站被降权了吗果就把site首页不在第一位就来判断网站是否降权,那就太荒谬了。很多情况都出现site不在首页

    2129
    • site命令
    • 首页降权
  • 内容模块之间为何要设置合理间隔

    页面为何要设置合理间隔

    内容模块之间为何要设置合理间隔,主体内容应与广告、相关推荐等次要内容板块之间有明显间隔距离或分割线,使用户获取信息时不受任何干扰。”本文将为你详细讲解如何设置合理间隔更符合用户浏览页面信息的需要。

    1308
    • 页面为何要设置合理间隔
  • 造成百度spider抓取异常的原因

    百度spider,抓取

    有一些网页,内容优质,用户也可以正常访问,但是Baiduspider却无法正常访问并抓取,造成搜索结果覆盖率缺失,对百度搜索引擎对站点都是一种损失,百度把这种情况叫“抓取异常”。对于大量内容无法正常抓取的网站,百度搜索引擎会认为网站存在用户体验上的缺陷,并降低对网站的评价,在抓取、索引、排序上都会受到一定程度的负面影响,最终影响到网站从百度获取的流量。

    135
    • 百度spider
    • 抓取
  • 大多数站长搞错了SEO的核心

    SEO的核心,seo优化

    大家觉得SEO优化的核心重点是什么呢?关键词排名展现,如果您是这么认为的那请看完这篇文章,你会有不同的感悟。SEO的核心并不是在于关键词的排名,关键的排名只是途径。

    388
    • SEO的核心
    • seo优化
  • 网站建站没有考虑SEO优化的弊端

    网站建站SEO优化

    今天来讨论一个问题先有SEO还是先有网站呢?一个个小小的先后顺序结果却是天壤之别。大多数的情况都是网站先存在,然后觉得需要一个SEO然后就招来一个SEO来优化网站,一般来说这样的网站都是一个巨坑,如果建站的懂一点SEO那么还好,反之那么基本上都是人间悲剧。

    1234
    • 网站建站SEO优化
  • 百度不收录网站怎么办

    网站不收录

    百度不收录网站怎么办,不收录对于SEO人员来说是一个致命一击。我们如何才能保证网站出现不收录的问题,当网站出现收录问题的时候我们又应该如何应对呢?

    730
    • 网站不收录
  • SEO优化核心之关键词筛选

    ·关键词筛选,SEO优化核心

    ·对于SEO优化关键词的筛选作为核心,应该是大家都认同的。如果能够真的掌握关键词筛选的真谛,那么成为一个高手也不是不可能。

    753
    • ·关键词筛选
    • SEO优化核心
  • 百度站长平台的外链分析工具

    外链分析工具

    百度站长平台的外链分析工具解析,一个网站发外链最多有多少条有效?发布的外链哪些会进行投票加分?同页面两个外链会计算哪个外链进行投票?

    2216
    • 外链分析工具
  • SEO站内外优化的差异

    站内外优化差异

    SEO优化可以分为站内优化和站外优化,那么在两者之间我们应该重点优化哪一个呢?以及站内的优化的方式各有哪些方面呢?

    1558
    • 站内外优化差异
  • 文章长度多少百度才收录

    文章长度收录

    很多人会有一个疑虑页面字数控制在多少可以更好的被搜索引擎收录呢?对于这个问题我们的分析是收录的核心关键点是什么,待你明白那么也就不会取纠结于这个字数问题,因此字数于收录与否没有直接的关系。

    713
    • 文章长度收录
-- 这已经是底线了,看看别的把! --