百度极光算法和其它的算法有所不同,激光算法是为了保护而生而不是打了打击什么违规行为。极光算法是一种落地页的时间规范的算法,主要的目的是为了保护原创站点的内容归属问题。
百度激光算法的意义
大家都知道现在对于SEO优化来说,内容是至关重要的,现在是一个内容为王的时代。只要内容做得好站点就不会差到哪里去,然后这一切依托的内容却成了优化的最大的问题。很多的原创站点的内容被其它站点抄袭转载,还会存在比原创站点先收录的问题。这对于认真做内容的中小站点是一种不公,对于内容原创的生态是一个很大的打击。百度极光算法的存在就是为了更好的判定内容的原创站点,确定内容的归属问题,从而更好的保护原创站点的权益,对搜索生态及公平性提供保障。
极光算法的实现方式
这里的重点就是在于发布时间,对于搜索引擎可以通过对页面的发布时间的抓取,来确认网站页面的发布时间,然后从各个网站相同内容的发布时间的先后去判定谁是第一作者。
时间抓取存在的问题
各个站点各有特色,不同站点对于发布时间字段的显示位置各有不同;甚至有的站点页面是不显示发布时间的。因此百度极光算法更多的依靠百度时间因子,通过规范的时间格式来时间网站页面发布时间的标记。
时间的可信度
不管是网页显示的时间,还是百度时间因子中的时间,都是可以被网站数据库修改所控制。通过修改可以实现把发布时间修改成发布之前的时间,伪装成自己站点是最早发布的。对于这种作弊的方法是不可取,也许修改个别的页面的时间的确是很难发现。但是在大数据的背景下就很容易穿帮,假如你是一个修改发布时间的惯犯,那么搜索引擎抓取内容的发布时间都是很久之前的,那么当搜索引擎加快每日的抓取频次的时候依然还是发现,每天会抓取到内容还是比较久远,很少抓取到接近抓取时间的内容。
时间因子请勿滥用
或者说其他站点在推送新内容链接,搜索引擎抓取收录了,然后当抓取到你的网站而你的发布时间更加的久远,在少量数据下可能就是抓取不够及时,你才是原作者;但是当你的内容在很大数量的站点都出现这个问题,那么就显而易见的不合逻辑,推断就是你的发布时间有问题。
因此,对于发布时间的认定并不是页面或者时间因子写什么时候就会被采纳,而是会有更加复杂的算法,对发布时间的真实性有着评估。一但网站在时间方面作弊,那么久而久之,搜索引擎对于网站的信任度必然是下降的。