首页 >  SEO >  SEO心得 >  正文

搜索引擎的基础原理知识

 作者:潘某人SEO
870

虽然说年轻人不讲武德,但是你和他讲搜索引擎还是讲不通的;虽然大多数人不知道搜索引擎的工作原理,但是怎么使用的话,大多数人都是溜溜的。只要在搜索引输入我们需要搜索的关键词,就可以在瞬间获取到我们想要的内容。

对于外行来说他只关注搜索到的内容,但是对于有一个SEO来说,应该会思考搜索引擎是如何的从海量的数据之中快速精准的找到我们需要的内容的。可以这么说很多人做SEO但是从来没有探索过搜索引擎的工作原理。今天我们就一起来探索下搜索引擎的一个基本的工作原理及流程,我们可以简单的把搜索引擎分为四个步骤:抓取、过滤筛选、建立索引及输出结果。


抓取

内容的抓取相信大家都是非常的了解的,就是我们乐此不疲的收录。搜索引擎的抓取内容是通过爬虫蜘蛛来实现的,各大搜索引擎的蜘蛛会根据自家的算法来对互联网上的各大网站进行数据的抓取。

面对互联网上海量的数据,如果每日对所有网站的数据进行实时的抓取显然是一件不可能完成的事情。因此对于搜索引擎的抓取工作是一项非常复杂的工程,是在很多算法的共同作用下,最终实现对于各个网站的评级给到不同优先级别进行抓取工作,来达到在有限的资源条件下获取更多有价值的信息。

搜索引擎的工作原理

过滤筛选

很多人认为内容被抓取了就会被收录,其实并非如此;其实你可以看一下网站日志,只要网站是一个正常的网站没有被K站,基本上新内容提交连接推送之后,过一段时间蜘蛛肯定是回来进行抓取的。

但是事实上,我们有很多内容是有抓取记录但是却一直是不收录的,这个其实主要是内容的质量并不达标,在抓取之后是有一步过滤筛选的,对于页面存在问题或者内容的意义不大的页面,基本都是会被直接过滤掉,是完成没有被收录的机会的。


建立索引

上边也讲到了当我们在搜索框输入搜索词之后可以在瞬间返回结果,那么必然不是得到关键词之后再去检索相关内容的;所以搜索引擎对于抓取的内容会建立相关的结构数据建立对应关键词的搜索引,也就是我们常说的索引量。

网站内容建立索引是被搜索到的基本条件,只有对关键词事先建立了索引数据,这样才有可能做到在搜索的瞬间呈现出结果。


输出结果

当然用户搜索的关键词是千奇百怪的,充满了无数的可能性,因此也不能对搜索有关键词都创建对应的索引,这个时候更多时候还是需要依靠算法,将搜索关键词和现有搜索引库中的数据进行一定关系上匹配,找到最相关的内容进行一个呈现。



申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于站点原创或CC0协议图库站点或已获得VRF授权的图库站点 版权申明:本文为博主原创,未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本文地址:https://www.chateach.com/seo/seoxinde/617
相关文章
  • 伪静态和动态url的区别

    伪静态,动态页面

    网站优化只用静态还是动态链接,大家都为异口同声的说道,做SEO优化肯定要使用静态或者伪静态链接的,这样才利于搜索引擎的抓取;动态链接是很难被抓取收录的。难道动态链接真的就不能使用了吗?真的不能被收录吗?

    944
    • 伪静态
    • 动态页面
  • 巧用Robots避免蜘蛛黑洞

    Robots,蜘蛛黑洞

    搜索引擎的蜘蛛黑洞指的是搜索引擎蜘蛛在抓取站点内容的时候出现了大量雷同内容的url,导致搜索引擎蜘蛛一直被困在无限的循环中,如黑洞一般。直接的结果就会导致消耗大量的抓取资源。

    626
    • Robots
    • 蜘蛛黑洞
  • 网站内链锚文本布局方法

    锚文本优化

    当搜索引擎抓取页面时,遇到了锚文本链接进行了抓取,如果只是单纯的超链接而不是锚文本,那么对于搜索引擎那么对于链接的内容是一无所知。锚文本的价值就是可以大致的告诉搜索引擎,此链接下的内容大致什么。

    1356
    • 锚文本优化
  • seo的主要策略和流程内容

    整站优化策略

    整站优化策略、介绍seo的主要策略和流程内容。对一个网站进行综合的优化,包括了域名选择、网站结构或栏目设置、内部及外部链接,内容建设,访问者体验等多个方面进行的优化。

    1955
    • 整站优化策略
  • 如何快速的生成sitemap网站地图

    sitemap,如何制作,网站地图

    如何快速的生成sitemap网站地图,我们不能依靠工具来实现,因为逻辑上就走不通,其实通过数据库可以快速有效的生成最有价值的sitemap网站地图。

    1441
    • sitemap
    • 如何制作
    • 网站地图
  • 百度死链提交工具使用说明

    百度死链提交

    百度死链提交工具使用说明,当网站死链数据累积过多时,并且被展示到搜索结果页中,对网站本身的访问体验和用户转化都起到了负面影响。另一方面,百度检查死链的流程也会为网站带来额外负担,影响网站其他正常页面的抓取和索引。

    6158
    • 百度死链提交
  • 百度移动适配工具如何使用

    移动适配工具

    百度移动适配工具如何使用?百度移动搜索提供“移动适配”服务,如果您同时拥有PC站和手机站,且二者能够在内容上对应,即主体内容完全相同,您可以通过移动适配工具进行对应关系提交。

    2009
    • 移动适配工具
  • 网站被黑常见问题解析

    网站被黑

    网站被黑一直是搜索中非常常见的问题,由此小编梳理了几个网站被黑的问题及处理方法,供大家学习及防护~

    517
    • 网站被黑
  • 各搜索引擎蜘蛛IP大全持续更新

    蜘蛛IP,引擎蜘蛛

    各搜索引擎蜘蛛IP大全持续更新,各个搜索引擎的蜘蛛ua,持续更新中。

    2237
    • 蜘蛛IP
    • 引擎蜘蛛
  • SEO应聘注意事项

    SEO应聘

    SEO优化是一项充满着愚公移山精神的工作,特点就是做了不一定有效果,并且见效特别慢,这也导致了很多SEO从业者在这个岗位上很难稳定,因此在前期应聘的时候就需要注意以下方面来避免它日的悲剧。

    582
    • SEO应聘
  • 百度闪电算法,移动页打开速度

    百度闪电算法

    2017年10月初,“闪电算法”上线,移动搜索页面首屏加载时间将影响搜索排名。移动网页首屏在2秒之内完成打开的,在移动搜索下将获得提升页面评价优待,获得流量倾斜;同时,在移动搜索页面首屏加载非常慢(3秒及以上)的网页将会被打压。

    1838
    • 百度闪电算法
  • 域名后缀对seo的影响

    域名后缀SEO影响

    域名后缀以及域名的长短会对网站seo产生影响吗?早期来说域名的后缀对于SEO优化不会有任何的影响,但是随着这个行业的发展慢慢的出现了群站,如今是否存在影响也是成为了一个不确定的因素。

    2082
    • 域名后缀SEO影响
  • TF-IDF技术在搜索引擎中的作用

    TF-IDF,搜索引擎

    TF-IDF技术在搜索引擎中的作用,事关如何更好的选择关键词,如何获得更好的排名的关键。掌握了解TF-IDF技术对于搜索引擎的作用可以让你更在SEO优化中更好如何筛选和优化关键词。

    322
    • TF-IDF
    • 搜索引擎
  • SEO优化失败的原因

    SEO优化失败的原因

    SEO优化失败的原因解析,对于SEO优化来说到底是内容重要还是代码优化重要,最终又是什么导致了网站优化失败的结局,如何避免失败?

    1363
    • SEO优化失败的原因
  • IP地址段表达方式

    IP地址,IP区间段,ip表达式

    ip/8/16/24,IP大家在熟悉不过了,但是大家真的了解IP吗?如何表示一段区间的IP端呢?在网站优化的时候IP的屏蔽是经常需要做的一件事,如果需要屏蔽的IP都在一个段区间内,你还在一个个屏蔽吗,有没有一种快速屏蔽一段IP的方法吗。

    2396
    • IP地址
    • IP区间段
    • ip表达式
  • 什么样的外链才是高质量外链?

    高质量外链标准

    外链建设是SEO优化中重要的一项,可以有效快速的提升网站的抓取数量,其实是对于新站更加有意义,可以快速的提升网站的权重,但是随着搜索引擎算法不断的迭代,也推出了打击外链买卖作弊的行为,比如百度搜索引擎就有绿萝算法。

    781
    • 高质量外链标准
  • SEO网站页面优化的注意事项

    页面SEO优化

    网站的页面优化主要从用户体验的角度和内容质量出发,用户体验在如何的SEO优化中占据的比重越来越大,而内容则是SEO优化的核心。今天就来探索下我们如何才能做好网站页面的优化呢?

    1087
    • 页面SEO优化
  • SEO关键词布局优化方案

    SEO优化方案

    网站的关键字布局一直是大多数seoer注重的一个关键方面。关键字布局与用户的需求相关。然后,根据对有效竞争对手的分析,总体规划布局是合理的。你对网站的关键词布局出了问题怎么办?

    1129
    • SEO优化方案
-- 这已经是底线了,看看别的把! --