首页 >  SEO >  SEO知识 >  正文

巧用robots避免蜘蛛黑洞

 作者:潘某人SEO
1314

今天我们来了解下什么是蜘蛛黑洞,黑洞大家应该有一定的了解,属于一种高质量高引力天体,包括光任何的物体都无法逃逸。蜘蛛黑洞既是蜘蛛进入之后无法再出来,对正常的抓取工作产生负面影响。

造成蜘蛛黑洞的原因

有些站点含有大量的重复页面,常见的如站点的内容雷同,但具体参数不同的动态URL ;就会导致蜘蛛抓取大量相似或者相同的内容,导致有限的抓取频次被消耗殆尽,一定程度上影响了有价值页面的及时收录。

巧用robots避免蜘蛛黑洞

重复内容其实很难避免,比如有的站点内容页面有筛选功能,通过不同的条件去筛选显示对应的内容,常用的技术有点就是根据条件通过ajax查询反馈结果到当前页面,就会导致不同的查询结果,出现同一个链接带不同参数的url出现。最终就导致展现有大量的带参数的重复url被收录。不仅仅会影响搜索引擎的抓取,站点出现大量的相似内容也会对网站的评级产生影响。

屏蔽动态链接

对于这类情况处理还是很简单的,就是屏蔽所有动态链接的抓取,通过robots.txt文件规则来实现。在robots文件中添加Disallow: /*?* ,即禁止搜索引擎访问网站中所有的动态页面。这样就可以简单高效的屏蔽了低质量页面的抓取,有效的避免了蜘蛛黑洞的出现。

但是有的时候某些站点的动态页面是有价值的,是需要被收录的,直接屏蔽所有动态页面的抓取是不合理的;可以在Disallow: /*?* 的下一行添加允许抓取的动态链接,比如站点"/seodd"目录下的动态链接允许抓取,那么就是添加一行 allow: /seodd/*?* 。如果需要放通的比需要屏蔽的更多,就可以一个个目录屏蔽,而不是屏蔽所有目录再去放通某个目录。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/691
相关文章
  • 多个域名对网站seo有什么影响

    多域名解析

    多个域名对网站seo的影响你知道吗?对于多域名解析的态度就是能不用就千万别用,对于网站权重和收录都会有着严重的影响,处理不当那么对于网站优化是一个致命伤。

    1897
    • 多域名解析
  • 什么是nofollow标签

    nofollow标签

    解释了什么是nofollow标签,以及nofollow标签的只用方法,以及对于SEO的作用,合理利于这个标签可以集中页面的权重分配传递!

    1434
    • nofollow标签
  • ETag对于SEO优化的作用

    ETag,SEO优化

    ETag,全称Entity Tag,中文名为实体标签,是HTTP协议的一部分。它是Web服务器和浏览器用于确认缓存组件有效性的一种机制。合理正确的使用ETag对于seo优化可以起到非常大的帮助,今天就和潘某人SEO一起来了解下ETag是何为以及对SEO优化起到了何种作用。

    204
    • ETag
    • SEO优化
  • “TF-IDF”算法与网站SEO关系

    TF-IDF算法

    “TF-IDF”算法与网站SEO关系?这个算法决定着什么样的词可以成为网站的关键词,同时决定着页面在搜索引擎的排名竞争力。TF-IDF​是一种核算方法,用以评价一字词关于一个文件集或一个语料库中的其间一份文件的重要程度。

    2533
    • TF-IDF算法
  • 域名泛解析对SEO优化的影响

    泛域名解析

    域名泛解析对SEO优化的影响超乎你的想象,通过泛域名解析来增加抓取及收录,在现阶段基本可以认为是提条绝路,基本上是百害无一利。

    3278
    • 泛域名解析
  • SimHash算法,关键词堆砌打击

    SimHash算法

    Simhash算法又被SEO站长们成为关键词匹配算法,当用户搜索一个关键词的时候,会出现相关的网站进行展现,但是前些年有个别站长发现关键词密度越高排名越好,这是搜索引擎前期的漏洞,Simhash算法(也成分词匹配算法)对关键词堆砌起到了决定性的打击,

    2898
    • SimHash算法
  • 想要做好网站seo优化内容,需要知道这几点

    seo优化,网站内容

    近年来网站seo优化越来越难做了,那是凡事都有双面性,网站seo优化越来越难,那么逐渐的会更多站点及优化人员逐渐的放弃被淘汰,这也正是大家机遇。如今很多人在唱衰seo,从相关的统计数据可以看到搜索引擎的用户量和搜索量依然强劲庞大,虽然说新媒体平台近几年的发展态势迅猛,但是需要知道此类流量性质和搜索引擎还是有很大区别的。

    598
    • seo优化
    • 网站内容
  • 搜索引擎的基础原理知识

    搜索引擎原理

    搜索引擎的基础知识,从抓取、过滤筛选、建立索引及输出结果,这几个步骤的工作原理。对于SEO优化来说如果连搜索引擎的基本工作原理都不清楚,这样是一件非常糟糕的事情。

    994
    • 搜索引擎原理
  • 收录和索引别搞混了!

    收录,索引

    ​我敢说很多人连收录和索引都会搞错,当你觉得这么简单的怎么可能错的时候,搞不好你就是其中之一,今天就你了解下收录和索引的区别,各个搜索引擎大同小异,以百度搜索引擎为例。

    933
    • 收录
    • 索引
  • 别让推广追踪url链接毁了你的SEO

    追踪链接,跟踪链接

    推广追踪url链接也就是我们常说的跟踪链接,它可以帮助我们实现对于广告投放效果的追踪。不管是常见SEM推广,其它的推广方式都需要用到跟踪链接,但是很多站点没有正确的使用,不知不觉中对站点的SEO已经造成了不利的影响。

    749
    • 追踪链接
    • 跟踪链接
  • h1标签对seo优化重要吗

    H标签SEO优化

    H标签可以通过重要程度分为H1>H2>H3>H4>H5>H6.........,那么很多都会想到既然H1标签可以突出页面的重点,那么岂不是对于想要优化的关键词我们可以使用H1标签来突出它?

    1423
    • H标签SEO优化
  • 如何正确理解SEO关键词

    SEO关键词

    关键词作为SEO优化的核心点,作为一个合格的SEOER对于关键词有一个正确的认识是非常的重要的,对于关键词的认知有多深,决定了在SEO优化这条路上可以走多远。

    783
    • SEO关键词
  • 网站改版301跳转,你踩坑了吗?

    301跳转,重定向,网站改版

    当网站改版时,新旧页面的链接地址或者是网站域名发生变化时,就需要在对应的搜索引擎提交网站改版规则,然后在做301跳转,这是网站的常规操作,相信大多数都知道,但是你真的觉得这么简单吗?

    646
    • 301跳转
    • 重定向
    • 网站改版
  • 百度冰桶算法,移动页用户体验保护

    百度冰桶算法

    百度一直都在打击移动端用户体验不好的网站,从app的强制下载到现在的广告位置布局,冰桶算法是专门为了移动端体验效果而生的算法,为了提高移动端的用户体验效果

    2484
    • 百度冰桶算法
  • 如何防止假蜘蛛抓取内容

    假蜘蛛,防采集,原创保护

    如何让网站自动识别蜘蛛的真假,如何自动的屏蔽假蜘蛛抓取网站内容,从而更好的保护网站的原创内容呢?

    1835
    • 假蜘蛛
    • 防采集
    • 原创保护
  • 已收录页面修改对排名有影响吗?

    收录页面修改的排名影响

    对于已收录页面的修改对于网站的运营之中是不能再常见的事情了,那么修改已收录页面会影响收录吗、会影响已有的关键词排名吗?这是多数SEO优化人员所纠结的问题,又想修改页面但又不敢大动页面。

    1941
    • 收录页面修改的排名影响
  • SEO攻击防御与效果稳定

    seo优化

    当你的站点在行业内有了一定的知名度和影响力之后,那么不可避免会遭受到攻击抄袭模仿,那么我们又应该如何面对这些情况呢?今天就从技术和内容的角度讲到的讲一下如何处理此类情况。

    1481
    • seo优化
  • 域名注册注意什么

    域名注册注意点

    域名注册注意什么?对于网站优化来说域名的选择是非常重要的,如果在域名的选择注册时发生了错误,那么对于网站后续的SEO优化是一个非常不利的起点,对于任何一件事一个好的开始是成功的一半。

    937
    • 域名注册注意点
-- 这已经是底线了,看看别的把! --