首页 >  SEO >  SEO知识 >  正文

robots协议不生效怎么处理

 作者:潘某人SEO
608

大家有没有发现很多时候我们在robots文件中添加了禁止抓取的内容,但是还是被正常的收录了,这个就比较气人了有的人是不管怎么折腾就是不收录,有的人禁止抓取的内容尽然还在收录,没有对比就没有伤害!
那么为什么明明已经设正确设置的robots的屏蔽规则,但是就是不生效导致不该收录的内容被收录了呢?
robots更新周期
造成这一问题主要的原因,潘某人SEO认为主要还是在于robots的更新周期,搜索引擎每次抓取网站的内容的时候并不会每次都抓取下robots文件,因此很多时候站点更新了robots文件的规则了,但是搜索引擎并没有抓取最新的robots规则,还是会按照之前的规则进行抓取。
如何避免
首先网站搭建的时候就应该做好结构的规划,在网站上线的时候就应该完成robots文件的配置,避免后期去调整,是最有效的方法。但是在实际情况中很少有站点可以做到这一点,那么在robots文件规则发生变化的时候,要避免不该收录的内容被继续收录的问题,就需要及时通知搜索引擎站点更新了robots文件。
以百度搜索引擎为例子,百度搜索资源平台为站长们提供了相关的robots更新工具,在robots文件更新之后,可以前往这个工具进行更新,从而加快搜索引擎发现robots更新周期,如下图所示。
百度robots更新
已收录内容如何处理
即使我们已经进行了robots规则更新,但是已经收录的内容,虽然在robots文件中进行了屏蔽,但是这些已收录的内容往往需要很长一段时间才会消失,甚至有可能长期不消失。
其实当我们最新版本的robots文件生效之后,新收录的内容会规则当前规则进行;但是已经收录的内容并不会马上消失,而是要等待之后的再次抓取的时候才会生效。然而不同的站点的已收录内容的抓取周期上的差距会很大,即使是同一个站点,不同内容的抓取更新周期也不一样。
如何加快已收录内容的删除
有时候一些已经被收录的内容,需要快速的让搜索引擎删除收录,仅仅靠robots文件进行屏蔽是做不到的。潘某人SEO在此分享一个简单高效的方法,那就是死链接提交。将误收录的页面状态码设为404,但如果页面仅仅只是不想被搜索引擎收录,但是还是允许被用户访问。
那么这个时候就不可以简单粗暴使用404页面,这个时候就可以通过后端根据客户端的user-agent判断当前访问如果是属于搜索引擎则返回404页面,其它的访问者则正常的访问。然后在搜索引擎提交死链,会比你单纯的等待robots文件生效的效果高很多。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/1020robots
相关文章
  • robots文件有什么用

    robots有什么作用

    robots文件作用对于SEO优化不可忽视给i,可以有效提高网站内容的质量减少重复收录,保护隐私数据不被抓取!

    1609
    • robots有什么作用
  • robots文件里该不该加上sitemap地址

    robots里放sitemap

    robots文件里该不该加上sitemap地址,有种说法就是搜索引擎抓取一个网站首先会抓取robots文件,这样把sitemap地址写在robots文件里,这样搜索引擎可以地址直接的对网站地图进行抓取,可以加快链接收录的速度,真相并不是这样

    2185
    • robots里放sitemap
  • 巧用robots避免蜘蛛黑洞

    robots,蜘蛛黑洞

    今天我们来了解下什么是蜘蛛黑洞,黑洞大家应该有一定的了解,属于一种高质量高引力天体,包括光任何的物体都无法逃逸。蜘蛛黑洞既是蜘蛛进入之后无法再出来,对正常的抓取工作产生负面影响。

    1314
    • robots
    • 蜘蛛黑洞
  • SEO优化必须掌握的robots文件协议

    robots,SEO优化

    robots文件使用来申明网站哪些内容允许搜索引擎抓取,哪些内容禁止搜索引抓取的;正确的设置robots可以提升搜索引擎对网站的抓取效率,同时避免不必要的内容被抓取展现。但在实际运用中很多站点没有正确的使用robots导致了一些问题,今天潘某人SEO就为大家揭秘下robots的注意点。

    804
    • robots
    • SEO优化
  • 巧用Robots避免蜘蛛黑洞

    Robots,蜘蛛黑洞

    搜索引擎的蜘蛛黑洞指的是搜索引擎蜘蛛在抓取站点内容的时候出现了大量雷同内容的url,导致搜索引擎蜘蛛一直被困在无限的循环中,如黑洞一般。直接的结果就会导致消耗大量的抓取资源。

    734
    • Robots
    • 蜘蛛黑洞
  • 如何屏蔽某些页面的抓取,但是让页面中链接正常抓取

    meta标签屏蔽页面抓取

    如何屏蔽某些页面的抓取,但是让页面中链接正常抓取,对于这种情况,使用meta标签来进行屏蔽页面的抓取,可以变得更加的有效。相比常用的robots文件屏蔽,或者nofollow标签屏蔽的实用性更加的广。

    3102
    • meta标签屏蔽页面抓取
  • SEO标题写法规范

    SEO标题写法规范

    SEO标题也就是我们常说的title标签的写法规范,标题对于直觉决定了网页获取点击的能力,影响度也是远远高于文章描述的,在搜索引中展现时,用户最注意的就是标题,因此学会书写一个合格标签至关重要。

    1725
    • SEO标题写法规范
  • 百度站点平台权限被回收

    百度站点平台

    ​2021-07-08百度搜索资源平台发布公告关于回收违法违规站点平台权限,也就是说部分站点会被回收站长平台的权限

    815
    • 百度站点平台
  • 何为百度快照劫持,如何避免?

    百度快照劫持

    百度快照劫持是利用黑客技术拿到了你的ftp,或者应用网站漏洞,来篡改网站的网页内容,主要的通过在网页中插入js代码实现跳转,而当你检查网站代码的时候很难发现问题所在,如果没有一定的技术水平的情况下。

    1033
    • 百度快照劫持
  • 进入前100名的关键词如何提升排名

    关键词排名提升

    进入前100名的关键词如何提升排名如何提升?持续更新,切勿大动干戈,50-100名就是就是搜索引擎对页面最后的考察期,一旦进了50名那就不一样了。按照以往的经验来说,网站排名在这个区间会持续短则一个星

    1384
    • 关键词排名提升
  • 搜索引擎蜘蛛爬虫名大全

    搜索蜘蛛大全

    对于seo们清楚掌握主流搜索引擎的爬虫名称十分的关键,掌握各大搜索引擎蜘蛛爬虫,对我们开展网站SEO优化具有挺大作用;作者搜集了各大搜索引擎的蜘蛛爬虫UA,便于你需要时查看。

    1902
    • 搜索蜘蛛大全
  • 360不收录的原因

    360不收录如何解决

    相信很多的seo们遇到过这个问题,就是百度的收录很正常,排名也还可以,但是360可能连首页都不收录,或者是只收录一个首页,新站和老站都会出现这个问题,那么到底是什么原因造成的呢?如何解决360不收录的问题呢?

    1489
    • 360不收录如何解决
  • h1标签对seo优化重要吗

    H标签SEO优化

    H标签可以通过重要程度分为H1>H2>H3>H4>H5>H6.........,那么很多都会想到既然H1标签可以突出页面的重点,那么岂不是对于想要优化的关键词我们可以使用H1标签来突出它?

    1423
    • H标签SEO优化
  • 网站打开速度慢的原因及解决方案

    网页打开速度

    有些站点各方面优化都很注重,但是却忽略了极为重要的网站的打开速度。对于搜索引擎网站稳定的打开速度决定了蜘蛛的抓取频次及抓取成功率;对于用户,打开速度慢会选择直接关闭,导致流量的丢失。

    973
    • 网页打开速度
  • SEO已死?还是你没搞懂SEO

    SEO已死,

    SEO还值得做吗?9成以上的站点的SEO优化基本不会有很好的效果,基本都是已失败告终,你知道为什么吗?

    727
    • SEO已死
  • Site域名查询的不显示备案信息

    网站备案,site命令,收录量

    Site命令站长们应该非常的熟悉,只要在对应的搜索引擎输入”site:域名”就可以查询到站点的收录数量。同时顶部的小卡片中会显示站点的备案号和备案主体,但是有的时候会遇到有些站点就只有资格收录数量,没有任何的备案信息。

    1249
    • 网站备案
    • site命令
    • 收录量
  • SEO关键词优化策略

    关键词,SEO

    站点SEO关键词的优化策略应该是怎么样的。也许那个SEO从业者都有着不同看法对于这个问题,​大家SEO优化关键词的策略是怎么样的呢?

    576
    • 关键词
    • SEO
  • SEO优化未来发展方向

    SEO优化发展

    SEO优化未来发展方向?如何才能立于不败之地?对于做SEO优化来说,尤其是对于刚入行的优化者来说,会担忧这个行业的发展。入SEO这个行业有没有前途。必然SEO优化是一项充满着挑战变数的工作....

    1837
    • SEO优化发展
-- 这已经是底线了,看看别的把! --