在讲索引量和收录量的时候,就不得不反问下大家你真知道什么是收录吗?可以说大多数人对于收录的认知是错误,存在索引和收录概念混淆的情况。
什么是收录
很多人对于收录的认知就是在搜索引擎输入“site+域名”查询出来的数字,也就是可以在搜索引擎可以参与排名的页面数量。
其实这个并不是收录而是索引,和百度资源平台工具中的索引量是同一个数据,而site命令查询到的数据则是一个估值,并且这个一般都是偏大索引量数据。这个主要是site命令会统计的数据会包含一些重复的页面,比如移动和PC适配没做好,或者是重定向不完全,导致一些页面被重复计算导致的。
所以这个site数据没有必要过于关注,相对而言各个搜索引擎的站长后台的索引量的值更加准确有参考价值。
那么何为收录
所以大多数人认为的收录量其实是索引量,那么什么才是收录呢?当我们生成一个新页面之后,会提交url给搜索引擎或者蜘蛛主动来抓取。
只要搜索引擎成功抓取了当前页面,那么就是一个收录行为。所以收录的本质就是有多少链接被搜索引擎抓取过,这也意味着收录并不能直接带来页面的展现与排名。
收录和索引的关系
当页面被搜索引擎收录之后,会进入搜索引擎的数据库中,根据相关的算法分析,决定当前页面是否建立索引库,并且根据页面的价值决定,进入哪一层级的索引库。
只要页面进入上层索引库才有被展现的几率,所以一味的追求索引是没有意义的,整个网络上各个站点的大部分的索引都是一个低价值的处于下层库,进入上层库的几率渺茫,这也是为什么有的站点索引量很高,但是展现和流量却是很一般,就是因为索引质量度过低的原因。
而是否能够进入上层索引库的关键在于,首先需要保证内容的稀缺性的同时近期有搜索需求,简单的原创并不能保证可以进入上层索引的,甚至可能不被纳入索引库中。在上层索引库的内容可以有一定的展现和排名,排名位置就需要与页面的质量,主要是根据用户的行为反馈数据来调整;还有一定就是站点整体的评级也会一定程度影响页面的排名。