首页 >  SEO >  SEO知识 >  正文

SEO优化必须掌握的robots文件协议

 作者:潘某人SEO
803

robots文件使用来申明网站哪些内容允许搜索引擎抓取,哪些内容禁止搜索引抓取的;正确的设置robots可以提升搜索引擎对网站的抓取效率,同时避免不必要的内容被抓取展现。但在实际运用中很多站点没有正确的使用robots导致了一些问题,今天潘某人SEO就为大家揭秘下robots的注意点。

robots如何写

首先我们需要在网站的根目录下创建文件“robots.txt”,文件的编码格式必须为UTF-8;robots文件的访问路径为“域名/robots.txt”,站点需要保证此路径下访问可达性。路径和文件名必须按照上述方式来,不支持自定义。

参数1—User-agent

该项的值用于描述搜索引擎robots的名字,用于指定规则作用的搜索引擎,也是说我们可以通过User-agent指定不同的搜索引擎去执行不同的规则。

# 代表所有的搜索引擎
User-agent:*
# 此处添加所有搜索引擎遵循的规则

# 代表百度搜索引擎遵循的规则
User-agent:Baiduspider
# 百度搜索引擎遵循的规则
1
2
3
4
5
6
7

如果修改对应搜索引擎的蜘蛛名即可,蜘蛛名可以去各个搜索引擎的官方文档中获取;如果robots规则前后产生冲突的时候,那么就会按照最后的一条规则时执行。如果站点不存在robots文件,那么就是整个网站所有的内容都可以被抓取。

参数2—Disallow

Disallow 是用来定义禁止抓取内容的路径的参数,可以精确到某一条链接,也可以是一个目录。

参数3—Allow

Allow 是用来定义允许抓取内容的路径的参数,可以精确到某一条链接,也可以是一个目录,如果链接或者是目录没有被禁止无需添加也可实现抓取。Allow 的意义更多的在于是,当需要抓取的内容是在被屏蔽的目录之中的,就可以通过Allow 参数来定义被屏蔽的目录下,哪些内容又是可以被抓取的。
robots的常用命令1
robots的常用命令2

robots提交

如果搜索引擎支持robots更新提交一定记得去站长后台提交,因为搜索引擎不会频繁的抓取站点的robots文件,这就会导致规则更新了,搜索引还是会抓取一些不期望被抓取的内容,对站点的seo优化造成影响。
搜索引擎更新robots的周期一般需要1-2周的时间,这也是大家疑惑为什么规则明明正确的屏蔽了,还是被抓取了。此处还是一个非常关键的一点,robots主要是争对未被抓取的内容,如果内容已经被抓取收录,那么再去屏蔽相关路径也是无法删除这些内容的索引。
这种情况就需要大家先robots中做好屏蔽,然后对内容做404状态码返回,然后提交死链来实现索引内容的删除。如果这些内容还是允许被用户访问,但是就不希望被收录就会处理比较复杂。所以说robots一定要创建的早,并且前期做好规划避免后期修改,并在第一时间提交到搜索引擎站长后台,校验并更新robots,然后才是后续站点内容的更新,避免因为robots文件的生效周期问题,导致抓取非允许的内容。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seozhishi/928robots
相关文章
  • 百度移动适配状态说明

    移动适配状态

    百度移动适配状态说明,对于适配的状态成功失败原因的分析以及解决方案。当认为实际情况与您提交的情况相符时,才会对适配数据进行生效处理,这个校验时间大约为10天。

    3395
    • 移动适配状态
  • 索引量波动意味着什么?需要重视吗?

    索引量,流量,seo

    索引量的波动牵动了多少站长心,根据不可靠研究,据说索引量波动得足够猛,可以影响到站长们的心电图。尤其突然的下降,一次性掉了大半年积累到的索引量。那么遇到索引量大幅度波动对于站点意味着什么呢?

    609
    • 索引量
    • 流量
    • seo
  • 网站使用CDN会对SEO有什么好处

    CDN,SEO优化

    CDN 是构建在数据网络上的一种分布式的内容分发网,网站使用CDN会对SEO有什么好处,如何正确的使用cdn才能发挥对于seo优化的作用。

    929
    • CDN
    • SEO优化
  • 作为一名SEOER,你是否懂得一门编程语言

    seo优化与编程

    作为一名SEOER,你是否懂得一门编程语言,那么哪门编程语言更加合适呢?

    709
    • seo优化与编程
  • 出图率提升网站点击率关键

    出图率,网站点击率

    但是在同一页面可以展示的,关键词的飘红程度不会有很大的差距,毕竟关键不飘红也不可能有展示的机会。所以标题及摘要显示的内容对于用户的吸引力,更为的关键。出图率是更为关键的,对提升点击率。图片和文字对于人视觉上的吸引力,图片是远高于文字的。

    676
    • 出图率
    • 网站点击率
  • 巧用robots避免蜘蛛黑洞

    robots,蜘蛛黑洞

    今天我们来了解下什么是蜘蛛黑洞,黑洞大家应该有一定的了解,属于一种高质量高引力天体,包括光任何的物体都无法逃逸。蜘蛛黑洞既是蜘蛛进入之后无法再出来,对正常的抓取工作产生负面影响。

    1314
    • robots
    • 蜘蛛黑洞
  • 网站排名靠前的方法

    排名靠前的方法

    网站排名靠前的方法?如何让网站内容排到首页是所有SEOER们日思夜想的问题,其实当关键词的排名到了前50,或者说想进入前二页并不是简单的靠页面优化就可以达到的排名,无论你页面关键词布局多么合理,只要不是权重绝对高,基本上是很难进入前二页的。

    846
    • 排名靠前的方法
  • 建站系统搭建网站利于SEO优化吗?

    建站系统选择

    对于一般的企业建站为了便利性会选择使用建站系统来进行网站的搭建,但是使用建站系统却存在着很多问题,对于业务上或者SEO优化上都有着很大影响。然而对于中小企业使用建站系统模板来搭建系统主要还是成本、维护上上考虑,也是一种迫不得已的选择,那么使用建站系统建站我们需要避免那些问题呢?

    850
    • 建站系统选择
  • SEO站外优化怎么做

    SEO站外优化,站外推广

    SEO站外优化怎么做,SEO优化是离不开站外的优化工作,尤其是对于一些没有知名度,客户群体少的网站;这类站点如果不注重站点的曝光,那么原本先天不足的站点的流量增长就变得更加的困难。

    781
    • SEO站外优化
    • 站外推广
  • SEO优化一定需要做原创内容吗?

    SEO必须原创吗

    随着时代进步SEO优化可以说是越来越难,现在发展方向是内容为王,支持原创内容。那么对于我们网站优化的时候是不是就只有一条路一定要去更新原创内容呢?

    1588
    • SEO必须原创吗
  • SEO优化之网站速度优化

    SEO优化,网站速度

    网站加载速度优化是非常有必要的,不仅仅是对于SEO优化,对于用户的访问转化起到了决定性的作用,看来看看有哪些因素会影响网站速度吧!

    607
    • SEO优化
    • 网站速度
  • keywords、description已经不重要了?

    keywords和description,SEO标签,关键词和描述

    不要随大众觉得keywords、description,即SEO优化中常说的关键词和描述两大SEO标签不在重要,这种观点过于果断缺乏依据。无论搜索引擎怎么调整。

    2090
    • keywords和description
    • SEO标签
    • 关键词和描述
  • 如何禁止网页内容被复制

    如何禁止网页内容被复制

    现在SEO优化鼓励内容为王,也就是鼓励大家原创。那么问题来了,如果当我们在原创的时候自己的内容却在被别人抄袭,是不是很气人,今天教大家如何屏蔽网页内容的复制。

    1777
    • 如何禁止网页内容被复制
  • 如何交换友链及其注意事项

    友情链接交换

    在SEO优化中友情链接的交换,不能单纯只看交换网站的权重,网站的内容质量,以及内容的相关性,网站是否符合规定,等等等因素都是需要注意的。

    1513
    • 友情链接交换
  • 原创内容如何保护,防止被抄袭爬取

    原创保护,防止抄袭爬取

    如今搜索引发展趋势是内容为王,想要获得好的排名那么优质得内容是必不可少的。面对无数的抄袭者我们如何保护自己不被抄袭、页面被复制、防止爬虫爬取。

    1124
    • 原创保护
    • 防止抄袭爬取
  • 图片字体版权你注意了吗?

    图片版权,字体版权

    如果作为一个网站运营者,对于图片字体版权没有一个正确的认知,那么在你盈利之前可能就要做一个赔钱货了!

    882
    • 图片版权
    • 字体版权
  • 百度闪电算法,移动页打开速度

    百度闪电算法

    2017年10月初,“闪电算法”上线,移动搜索页面首屏加载时间将影响搜索排名。移动网页首屏在2秒之内完成打开的,在移动搜索下将获得提升页面评价优待,获得流量倾斜;同时,在移动搜索页面首屏加载非常慢(3秒及以上)的网页将会被打压。

    1932
    • 百度闪电算法
  • MIP Cache 服务下线通知

    MIP Cache关闭

    MIP Cache 服务下线通知,MIP Cache 服务至目前为止已上线了三年多,为 Web 生态输出了优质资源和更为快速的网页浏览体验。2020年6月1日 - 2020年6月30日:关闭站长平台 MIP 入口,逐步清退下线 MIP Cache 服务。

    1783
    • MIP Cache关闭
-- 这已经是底线了,看看别的把! --