我敢说很多人连收录和索引都会搞错,当你觉得这么简单的怎么可能错的时候,搞不好你就是其中之一,今天就你了解下收录和索引的区别,各个搜索引擎大同小异,以百度搜索引擎为例。
收录和索引的定义
收录和索引是搜索引擎抓取环中两个重要的过程,任何网页必须是先收录才索引,因此站点收录量理论上要大于等于索引量,两个数据越接近,说明内容整体质量非常不错。
什么是收录
很多人认为的收录就是在搜索引擎输入"site:域名"查询出来的数量,这个其实是错误,这个和站长后台的索引量是同一个东西,唯一的区别site值是一个估值,准确性低仅供参考,同时site结果可以帮助站长分析具体建立索引内容的页面,两者之间是一个互补的关系。
如果说site值是索引,很多人就开始疑惑了,site值比站长后台的索引值大很多,甚至是倍数关系。这个其实和网站的移动适配方式有很大的关系,站长后台的索引量的值是根据当前认证域名下的建立索引的链接数。但是搜索引擎site值是将当前域名下包含了移动PC的索引总计。
收录真正的定义是搜索引擎爬取了链接进行分析的这一个过程,索引收录量是没有任何工具可以统计。能够只能页面有没有被收录,只能通过网站日志去判定,收录量的统计意义不大。如果非要统计,那么只能通过网站日志去分析统计每日搜索引擎蜘蛛抓取记录,别无他法。
什么是索引
收录了解之后索引的定义就很清晰了,搜索引擎对收录的内容经过算法分析,认定为有价值的内容,对其建立索引。具体的索引数据可以通过各个搜索引擎的站长后台的索引量查询得到具体数值。
但是需要知道的一点,索引库是分层的,之后内容在上层索引库的才有展现的机会,否则基本就是备胎,被展现的几率基本没有。所以不要一味的追求的索引量,索引量和流量不是成正比关系的。
纠正错误
所以清楚索引和收录的定义之后,就一定要纠正之前的错误讲法,我们要严谨不然显得很low。也就是说大家口中一直喊的收录,其实是索引量,以后请用索引量代替嘴中的收录量。
而收录量意义并不大,没有统计的意义,唯一存在的价值是,当网站近期的索引量存在问题的时候,新内容无法建立索引的时候,可以在内容推送之后在网站日志中分析内容的抓取收录情况,来排查问题的所在。