首页 >  SEO >  SEO算法 >  正文

谷歌的算法与百度的算法到底有什么不同?

 作者:潘某人SEO
2078

简单讲,其不同是方方面面的。先明确一个概念。网页排序算法其实只是一个统称,并不对应一个唯一的具体算法,而是一个混杂了多种算法的排序逻辑,本质上是一个排序系统。就好像一道菜的做法,从洗菜、腌制、烹煮、调味是有很多道工序的,不是一句“大火烹算法”或“小火煮算法”能概括的。所以不能简单地说谷歌在用A算法,而百度在用B算法。两套系统是由不同研发人员,在不同的时间和地域,基于不同的资源、用户需求、用户反馈、设计思想、评价方式构造的两个不同的排序系统。可以类比MSN和QQ,亚马逊和天猫,它们的展现形式和使用体验或许类似,但内部构造的区别却是方方面面的。如果要准确回答这个问题,必须首先了解百度和Google各自的排序算法。

据坊间传闻,了解Google核心排序算法的全球总人数加起来不超过20人(包括Larry Page在内),而且这些人都在Google总部,甚至连前谷歌中国高##层都不在其中。当然这只是传闻,我相信实际人数会比这个高,其机#密程度也没到这种地步,但无论如何,我想LZ在知乎是不可能得到确切答案的(这种商业机#密即使真的有人知道,他也不可能明说的,否则就等着被起诉吧)。我只就信息检索常识的角度来说一下可能会不同的方面,以及它们对排序结果的影响,让大家有个大概的认识。这里不涉及任何公司的技术和机#密,所有涉及技术均可以从信息检索文献中查到。信息检索系统,仅就排序而言,主要流程可以归纳为两部分:特征选取,特征使用。前者选择/抽取特征,后者利用特征进行排位计算。所谓特征就是反应当前查询下,各个网页好坏的一个指标,比如PageRank,BM25,用户的个性化倾向,用户反馈等。匹配度越高的网页应该排序越靠前。

1)  特征选取的不同除了在信息检索学术界有很多公认比较好的特征两家都会使用外--比如关键词的命中比例、命中紧邻程度、命中位置、PageRank(百度用李彦宏申请专利的一个类似特征)。两个公司会根据自己不同的需要和想法使用不同的特征。比如Google的用户分布在全球各地,肯定要非常重视语言/地域特征,搜中文给中文网页更好,搜英文给英文网页就好,即使同样搜英文,大陆用户、美国用户期望看到的结果也往往不同。而百度由于在初期很长的时间内只做中文搜索,这些特征初期估计没有或者用的很轻。再比如google有gmail的账号体系,而百度有知道、贴吧的账号体系,两者能够获得用户的个性化特征也是不同的(关于个人信息的收集,互联网无隐私不是什么秘密,大家心里有数就好)。总之两家由于自身定位和信息来源的不同,拿到和使用的特征是不一样的。


百度与谷歌的区别


2)使用特征方法的不同(本身写了很多,想了想,这段还是删了,总之是传闻,若是假的大家得不到有效知识,若是真的我可能就说了不该说的,真是倍感压力。。。)仅科普一下这个概念吧,目前利用特征主要方法主要有两种:人工规则、机器学习。两者最大的区别在于,前者的规则是开发人员拍脑袋想出来的,后者的规则是使用统计学方法由机器学出来的(具体怎么学请参见《机器学习》相关知识,简单讲就是你先人工标注大量搜索结果,注意是大量的,并告诉机器哪些是好结果,哪些是差结果,然后让机器通过这些例子自己总结规律。之后就可以让机器利用这些规律自动判断新的搜索结果好坏了)。这两种方法其实各有利弊,人工规则精准,但过于武断,后期会变得过于复杂庞大,不灵活;机器学习更贴合实际数据,但需要大量准确的标注数据,且不善于针对性地处理比较罕见的查询。

总之,即使两家公司用相同的特征,使用的方法也不可能完全相同;如果都用机器学习,标注数据和优化标准会有不同;如果都用规则,具体规则也会不同。这一切取舍选择,会以大部分实际用户的需求作为准绳。从这个角度讲,百度不是更懂中文,而是更懂中国网民,尤其是占绝大部分的草根网民。综上所述,两者算法不同处有很多。但无论如何不同,占绝大多数的用户需求会决定最终的排序效果。所以从结果而言google多国语言搜索更好、学术搜索更高;而百度娱乐搜索更好、草根需求满足更好。除了某些在知乎写了不能发表的内容,无论方法有多不同,搜索结果都是由绝大部分用户需求所决定的。

申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于站点原创或CC0协议图库站点或已获得VRF授权的图库站点 本文参考于互联网如有侵权,请联系 pmrseo@foxmail.com删除 本文地址:https://www.chateach.com/seo/seosuanfa/394
相关文章
  • SEO网站内容一直不收录原因及解决方案

    不收录原因,SEO

    ​不收录原因及解决方案,自从2022年开始普遍可以感受到网站收录难、收录周期长。可以说让众多SEO从业者游走在失业的边缘。影响网站收录的原因很多,比如站点违规降权等因素,但是对于大多数的站点更多的还是由于内容的问题导致的收录问题。

    848
    • 不收录原因
    • SEO
  • “TF-IDF”算法与网站SEO关系

    TF-IDF算法

    “TF-IDF”算法与网站SEO关系?这个算法决定着什么样的词可以成为网站的关键词,同时决定着页面在搜索引擎的排名竞争力。TF-IDF​是一种核算方法,用以评价一字词关于一个文件集或一个语料库中的其间一份文件的重要程度。

    2428
    • TF-IDF算法
  • 影响网站页面加载速度的原因,如何提升加载速度

    页面加载速度,网站优化

    百度搜索对用户行为的研究表明,页面首屏的加载时间在1秒以内的页面,会带给用户流畅快捷的极速体验,而加载速度过长的页面,会加快用户的流失。谁在影响页面的加载速度?

    461
    • 页面加载速度
    • 网站优化
  • 百度几种链接推送方式对比

    百度链接推送

    网站内容如果想要实现快速收录,那么及时的提交新内容链接是直接有效的方法。对于百度搜索来说链接提交方式是比较丰富的,大致分类主动提交、自动提交、手动提交和sitemap提交,那么你知道这四种提交方式有什么区别呢?哪张方式可以更快使内容收录呢?

    1490
    • 百度链接推送
  • 跳出率对于网站排名的影响

    跳出率影响排名

    跳出率对于网站排名的影响,很多人认为网站跳出率高会影关键词排名,但是其实这是一种很荒谬的理论。要说跳出率影响排名,那么首先你得知道关键词排名的与跳出率之间存在哪些交集。

    1348
    • 跳出率影响排名
  • 商城网站如何进行SEO优化呢?

    商城SEO优化

    商城类站点流量只是一个最基本的,但是需要获得转化还有更加重要的方面综合考量,下面就列出商城站点需要注意的几个方面。

    1853
    • 商城SEO优化
  • seo地域标签添加方法

    seo地域展现

    通过seo地域标签添加方法,精准的展现在我们需要的地域,城市进行展现,可以解决很多公司业务是具有地域性的特点,业务的目标客户集中在某些地域的问题,实现更加精准的推广营销。

    1451
    • seo地域展现
  • 内容采集对于网站优化有什么影响

    采集对于排名影响

    内容采集、伪原创、抄袭等操作方式对于网站排名会不会有影响;凡事都有两面性,重点在于我们找到里面的平衡点,对于seo优化来说采集伪原创的方式并不是不可以使用,关键在于掌握其中的奥秘.....

    1125
    • 采集对于排名影响
  • 什么是面包屑导航

    面包屑导航

    什么是面包屑导航,使用面包屑导航的优点,面包屑导航的作用是告诉访问者他们目前在网站中的位置以及如何返回。

    696
    • 面包屑导航
  • SEO内容优化劣迹行为你有吗

    SEO内容优化

    不管你的站点是否需要SEO优化,都需要的是优质的内容,得用户者得流量。而在实际的运行中却十分不理想,普遍的存在着垃圾制造的行为。

    654
    • SEO内容优化
  • 百度信风算法

    百度信风算法,翻页诱导

    百度信风算法是打击翻页诱行为的算法, 是为了防止站点通过利用翻页进行诱导,从而保护用户的浏览体验。

    1785
    • 百度信风算法
    • 翻页诱导
  • SEO标题长度多少合适呢?

    SEO优化,标题长度

    ​标题在SEO优化之中是至关重要的,如果不会正确合理的写标题是很难做好SEO的,标题不仅仅是搜索引擎排名的重要的因素,同时也是重要的流量入口,一个好的标题是吸引用户点击的关键。因此,标题会一定程度上影响这排名站点和点击率。

    592
    • SEO优化
    • 标题长度
  • SEO优化权重的错误认知

    SEO优化,权重

    如果你觉得权重就是seo优化的衡量标准,那么一定要看完这篇文章。相信对你肯定会有帮助,首先公布结论,权重作为SEO效果的衡量标准,只能作为参考,并且参考意义的大小还要根据实际情况分析。

    709
    • SEO优化
    • 权重
  • 怎么让网站快速排名

    网站快速排名

    怎么让网站快速排名?快的排名方法就是网站建设的时候需要做好任何的细节优化,只有做好细节,才是网站优化本该做的事情,才是长久之计。而所谓网络上说的快速排名,其实就是利用某些搜索引擎的特点对优化的网站进行特殊的优化操作,

    848
    • 网站快速排名
  • 百度快照与权重的关系

    权重,百度快照

    百度快照与权重的关系,事实上百度快照并不能反映出搜索引擎蜘蛛抓取网站数据的时间,更不能决定页面的权重。所以大家不必过度的关注百度快照

    1311
    • 权重
    • 百度快照
  • 网站seo首页标题怎么写

    seo首页标题

    标题是一篇文章的核心,是对于全片内容的一个简明扼要的概括,同样一个网站的首页的标题是整个网站的一个门面,代表着整个网站的内容及属性。那么网站的标题应该如何写,又该考虑哪些因素呢?

    964
    • seo首页标题
  • 老域名对SEO优化效果有影响吗

    域名,seo优化

    相信大家经常听到建站要用老域名,对于收录排名会有很不错的优势,那么真的是这样吗?但这个结论是有一定的道理,但是还是比较片面,并不不能说老域名比新域名更利于SEO优化。

    759
    • 域名
    • seo优化
  • 百度不收录原因分析

    百度不收录原因

    百度不收录原因分析,目前百度Spider抓取新链接的途径有两个,一是主动出击发现抓取,二就是从百度站长平台的链接提交工具中获取数据,其中通过主动推送功能“收”上来的数据最受百度Spider的欢迎。

    1384
    • 百度不收录原因
-- 这已经是底线了,看看别的把! --