有些站点不管怎么折腾就是不收录,那你知道不收录的原因吗?我们如何知道站点不收录的原因。网站不收录的原因,大致可以分类两类:内容没有被抓取到和网站存在违规不符合收录标准。
收录量和索引量的区别
首先我们需要明白一个关键词,索引量和收录量的区别。很多人并不知道索引量和收录量的区别,可能觉得两者没有任何区别。收录量:收录指的是页面被百度蜘蛛,发现爬取分析过;索引量:收录内容经初步分析后认为有意义,做建库处理。
因此,收录量包含了索引量,收录是索引的先决条件;收录量永远大于索引量数据。
抓取频次过低
我们回归今天的话题,很多站点不收录的原因,在第一步的页面抓取上就除了问题。很多站点蜘蛛抓取频率过低,根本无法及时的爬取网站内容。所以这类站点就是需要提升网站的抓取频率,对于普通站点,日均抓取频率达到200+是比较正常的。
提升抓取频次的方法,适当的增加优质外链,增加蜘蛛爬取的几率;不过建议不过过多的依赖外链,还是需要提升蜘蛛对于站点的信任度,这样站点的抓取频率可以更加的稳定。
这个就需要几个月的时间去养成,我们要高频率的更新优质内容,并且主动推送网站链接以及提交网站的sitemap地图,逐渐抓取频次就会上去。
内容质量过低
有些站点的抓取是正常的,搜索引擎每日都会来抓取,但是收录并不很好。所以网站内容的收录是没有问题的只是内容的质量不达达标。没有被建立索引库,或者说在下层索引库。
索引量分多个层级,进入上层索引库才有更多与搜索用户见面的机会;进入下层库机会渺茫。
站点评级过低
有的站点的内容质量还是可以的,但是还是收录不好。这类站点其实主要还是网站的评级过差,多数出现在新站上或者是被降权的站点上。这类站点不是不收录,也不是不建立索引,只是索引放出来的时间比较长;也就是我们常说的收录慢,可能可能需要一个星期到几个月才能被放出来。
网站存在违规
对于存在违规的网站就没有什么可说的,比如被算法命中打击惩罚。那么收录就不要去想了,还是想想如何去补救来的实际。