首页 >  SEO >  SEO知识 >  正文

页面收录是一个怎么样的流程

 作者:潘某人SEO
1458

网站优化收录是我们每天关注的,但是你是否知道收录的流程呢?了解网页是如何被收录的,把收录的流程了解清楚对于优化工作是有很大的意义的。其实大家口中所说的收录准确来说应该是索引,索引和收录的区别简而言之,就是搜索引擎蜘蛛抓取了链接即为收录,然后经过算法处理建立索引,这个时候便可以在搜索引擎上搜索到结果,也就是我们常说的收录,所以准确的说应该称之为索引。

不管是什么搜索引擎,大致的原理都是一样的,整个收录过程大致可以分为三步,分别是抓取、识别、释放。而且一切的基础都是依托于搜索引擎蜘蛛的。蜘蛛在整个搜索引擎中是先头部队,负责去与各站点的服务器建立接连,抓取下载网页上的文字、图片、视频等内容。

爬行与抓取

抓取也就是上面讲到的收录,搜索引擎蜘蛛抓取到网页链接。我以百度搜索引擎为例,百度蜘蛛抓取链接的主要方式途径有,站点的链接推送、互联网上的外链。蜘蛛会抓取网页上的文字以及代码,生成一份快照保存在搜索引擎服务器。对于已经收录的链接,那么会根据算法决定是否去重新抓取,或者直接略过抓取。

识别

对于抓取来的数据,会进行文字提取、分词、语义分析等一系列复杂的过程,结合搜索需求等因素,决定当前页面适合符合建立搜索引的调价。这也是一个关键的环节,是为什么有的站点内容会被抓取,但是一个无法被收录。绝大部分就是在这个环节因为内容不达标,而不被建立索引库,那么后续的展现就无缘了。

页面收录流程

释放展现

对于满足条件的页面会建立搜索引库,在需要的时候进行释放。此时用户通过在搜索引数据搜索关键词,那么相关联的索引结果就会呈现给用户。结合页面与关键词的相关性以及站点的整体质量来决定显示的排名位置。

并且搜索引擎会根据用户浏览搜索结果时的行为反馈,来对于关键词的排名位置进行一个调整。

索引删除

我们有的时候会发展已经收录的内容,过段时间之后又被取消收录了。这个其实是一种很正常的现象,搜索引擎会根据最近的搜索需求,来删除过时没加价值的索引;同时也会放出更有价值的内容。

索引量下降20%甚至更多都是正常的,站点只需要关注流量的变化,不要过度关注搜索引量的变化,大家对于索引量要有正确的认识。当然如果索引量对半的掉同时流量展现都收到影响,那么就需要警惕重视,是否存在违规行为被打击。

申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于站点原创或CC0协议图库站点或已获得VRF授权的图库站点 版权申明:本文为博主原创,未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本文地址:https://www.chateach.com/seo/seozhishi/669
相关文章
  • 搜索引擎的工作原理

    搜索引擎工作原理,收录原理

    讲述搜索引擎的工作原理,以及SEO优化中如何提高收录效率的方法。提高网站内容的质量原创度,稀缺性,和搜索引擎建立良好的信任关系。

    1245
    • 搜索引擎工作原理
    • 收录原理
  • 搜索引擎如何判断内容的原创

    如何判断内容的原创

    搜索引擎其实并不能判断内容的到底是谁原创,看似有点惨无人道,原创成为抄袭。

    1528
    • 如何判断内容的原创
  • 如何让搜索引擎识别页面是PC还是移动端

    SEO页面类型识别

    如何让搜索引擎识别页面是PC还是移动端,让蜘蛛有效的识别页面类型,可以使得抓取更有效率,同时给用户在不同设备访问时,给到正确的对应页面,提升用户体验。

    2787
    • SEO页面类型识别
  • 搜索引擎蜘蛛爬虫名大全

    搜索蜘蛛大全

    对于seo们清楚掌握主流搜索引擎的爬虫名称十分的关键,掌握各大搜索引擎蜘蛛爬虫,对我们开展网站SEO优化具有挺大作用;作者搜集了各大搜索引擎的蜘蛛爬虫UA,便于你需要时查看。

    1791
    • 搜索蜘蛛大全
  • 搜索引擎高级搜索指令大全

    高级搜索指令大全

    搜索引擎高级搜索指令大全。普通的搜索肯定需要会,但是有一些特殊的搜索是SEO必修课程。下面就来介绍一下搜索引擎的特殊搜索——高级搜索指令。

    1434
    • 高级搜索指令大全
  • 百度搜索引擎蜘蛛喜欢什么样的网站结构

    seo网站结构

    百度搜索引擎蜘蛛喜欢什么样的网站结构?希望能在百度获得好的排名、更多优质低价的流量,这个前提就是网站得有好的结构,百度蜘蛛才能顺利、快速的抓取,也就是说网站结构是关键词排名、链接优化、内容优化的前提。

    1399
    • seo网站结构
  • 搜索引擎的基础原理知识

    搜索引擎原理

    搜索引擎的基础知识,从抓取、过滤筛选、建立索引及输出结果,这几个步骤的工作原理。对于SEO优化来说如果连搜索引擎的基本工作原理都不清楚,这样是一件非常糟糕的事情。

    870
    • 搜索引擎原理
  • 搜索引擎抓取系统概述

    搜索引擎,蜘蛛

    今天就给大家简单的介绍一下搜索引擎系统大致工作原理,内容比较多会分几次更新,大家记得关注“潘某人SEO”坐等更新。先给大家介绍下搜索引擎的基础知识:抓取系统基本框架、抓取中涉及的网络协议、抓取的基本过程三部分。

    922
    • 搜索引擎
    • 蜘蛛
  • 搜索引擎检索原理解析

    搜索引擎,检索原理

    搜索引擎检索原理解析,搜索引擎是如何实现关键词的精准匹配?

    1005
    • 搜索引擎
    • 检索原理
  • 搜索引擎内容原创性之分词技术与文本粒度

    分词技术,文本的粒度,内容原创性

    seo优化中内容的原创性是非常重要的,那么对于搜索引擎是如何判断内容的原创性呢?从分词技术和文本粒度来研究下伪原创内容对于SEO优化存在意义。

    700
    • 分词技术
    • 文本的粒度
    • 内容原创性
  • 各搜索引擎蜘蛛IP大全持续更新

    蜘蛛IP,引擎蜘蛛

    各搜索引擎蜘蛛IP大全持续更新,各个搜索引擎的蜘蛛ua,持续更新中。

    2237
    • 蜘蛛IP
    • 引擎蜘蛛
  • ChatGPT将革新搜索引擎跨入新时代

    ChatGPT,搜索引擎发展

    ​ChatGPT的发布代表着人工智能技术开启了新篇章,不少人开始纷纷感受到了恐惧,在不久的将来被ChatGPT所淘汰,这个就让我们拭目以待吧。作为SEO从业者,最关注的还是ChatGPT会对搜索引擎的发展带来何种影响呢?

    671
    • ChatGPT
    • 搜索引擎发展
  • 搜索引擎网页质量判定的标准

    搜索引擎,网页质量

    搜索引擎的根本是什么,是内容是对于用户搜索需求满足,这是搜索引擎最根本的逻辑,后续的一切也都是根据这个方向展开的。根据《百度搜索引擎网页质量白皮书》,站长们在百度搜索引擎优化中如何才能输出高质量内容呢?

    519
    • 搜索引擎
    • 网页质量
  • AI搜索会替代搜索引擎吗?

    AI搜索,搜索引擎,seo

    各大搜索引擎公司确实在积极研发并推出基于人工智能(AI)的搜索功能,不仅能提供更准确、更个性化的搜索结果,还能够理解复杂的查询语句,甚至提供对话式的互动,使得搜索过程更加自然和高效,未来AI搜索会替代掉搜索引擎呢!

    493
    • AI搜索
    • 搜索引擎
    • seo
  • 百度搜索引擎Spider抓取系统的基本框架

    搜索引擎,百度spider

    互联网信息爆发式增长,如何有效的获取并利用这些信息是搜索引擎工作中的首要环节。数据抓取系统作为整个搜索系统中的上游,主要负责互联网信息的搜集、保存、更新环节,它像蜘蛛一样在网络间爬来爬去,因此通常会被叫做“spider”。例如我们常用的几家通用搜索引擎蜘蛛被称为:Baiduspdier、Googlebot、Sogou Web Spider等。

    287
    • 搜索引擎
    • 百度spider
  • 百度搜索引擎优先建重要库的原则

    搜索引擎,百度spider

    Baiduspider抓了多少页面并不是最重要的,重要的是有多少页面被建索引库,即我们常说的“建库”。众所周知,搜索引擎的索引库是分层级的,优质的网页会被分配到重要索引库,普通网页会待在普通库,再差一些的网页会被分配到低级库去当补充材料。目前60%的检索需求只调用重要索引库即可满足,这也就解释了为什么有些网站的收录量超高流量却一直不理想。

    226
    • 搜索引擎
    • 百度spider
  • 一文带你了解百度搜索引擎抓取收录的原理

    百度seo,抓取,收录

    作为一个seo从业者三句话不离收录,但是大家对于收录的原理真的了解吗,相信很多了解到的就是蜘蛛来抓取然后内容收录,但其实这种理解是比较片面的,了解搜索引擎的收录原理对于提升收录是非常有帮助的。

    346
    • 百度seo
    • 抓取
    • 收录
  • SEO必看,搜索引擎是如何提取关键词?

    关键词,搜索引擎

    了解搜索引擎是如何提取关键词,是每个SEO必须必须知道的,否则很容易一不小心优化了个寂寞。如果你认为关键词就是自己在页面keywords中设置的关键词,或者只要重复某个词就可以成为关键词,那你一定要听劝看完这篇文章。

    337
    • 关键词
    • 搜索引擎
-- 这已经是底线了,看看别的把! --