首页 >  SEO >  SEO算法 >  正文

链接权重分析HITS算法的不足之处

2117

理解HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。HITS(Hypertext-InducedTopic Search)算法是利用Web的链接结构进行挖掘典型算法,其核心思想是建立在页面链接关系的基础上,对链接结构的改进算法。HITS算法通过两个评价权值——内容权威度(Authority)和链接权威度(Hub)来对网页质量进行评估。其基本思想是利用页面之间的引用链来挖掘隐含在其中的有用信息(如权威性),具有计算简单且效率高的特点。HITS算法认为对每一个网页应该将其内容权威度和链接权威度分开来考虑,在对网页内容权威度做出评价的基础上再对页面的链接权威度进行评价,然后给出该页面的综合评价。内容权威度与网页自身直接提供内容信息的质量相关,被越多网页所引用的网页,其内容权威度越高;链接权威度与网页提供的超链接页面的质量相关,引用越多高质量页面的网页,其链接权威度越高。

首先,它完全将网页的内容或文本排除在外,仅考虑网页之间的链接结构来分析页面的权威性,这与现实网络中的权威页面相比,其不科学性显而易见。 然而HITS算法也有其明显的不足。因为权威页面必须针对某一主题或关键词而言。例如某一页面对一确定主题具有较大权威性,但这并不意味在其他与其无关的主题方面同样具有权威性。其次一个页面对另一页面的引用有多种情况,其中包含了一页面对另一页面的认可,但除此之外也有其他目的链接,如为了导航或为了付费广告。就HITS算法的思想与实现过程做了细致的研究与概括。而HITS算法在实现过程中均没有考虑以上情况.导致了结果与目标的差距。


HITS算法的不足之处


对HITS算法的第二个不足,即非正常目的的引用.在HITS算法看来,也误认为是正常引用,导致实际结果与目标的出入。针对前面第一种不足,就有相关的学者提出了一种利用超链文字及其周围文字与关键字相匹配而计算超链权值的方法,并引入系数对周围文字和超链文字进行权值的相对控制,很好地将页面文本信息引入到HITS算法,提高了算法的可靠性,并在现实中取得了很好的效果。

后来,经过不断的改进。HITS算法又引入了时间参数,即利用对一链接引用的时间长短来评价是否为正常引用。因为非正常链接其引用时间肯定不会很长(如交换链接、广告链接),相反,如果一页面对另一页面的链接时间较长,则必然反映此页面就是用户的寻找页面。即目标页面或至少是正常引用。

如设定访问时间少于1分钟者为非正常引用。如果设定时间阀值,则可以将非正常引用的链接在HITS算法的实现过程中筛选出来。另外可构造时间访问函数,控制权威页面的相对大小。如随访问时间的增大而其权威性也逐渐非线性增大.这样可为HITS算法的权威页面提供更合理、更科学的解释。

申明:本站内容仅代表个人观点,仅供学习参考;未经授权任何个人或组织单位不得复制、转载、摘编以及其它形式的应用! 本站文章可能使用到互联网上的资料,若对您造成困扰,请联系 kk19@foxmail.com除理 本文地址:https://www.chateach.com/seo/seosuanfa/386
相关文章
  • 网站排名靠前的方法

    排名靠前的方法

    网站排名靠前的方法?如何让网站内容排到首页是所有SEOER们日思夜想的问题,其实当关键词的排名到了前50,或者说想进入前二页并不是简单的靠页面优化就可以达到的排名,无论你页面关键词布局多么合理,只要不是权重绝对高,基本上是很难进入前二页的。

    844
    • 排名靠前的方法
  • 换ip后导致不收录原因

    不收录原因,

    换ip或者服务器后导致百度不收录原因是什么你知道吗?大多数情况是DNS缓存问题导致的域名解析还没有生效,无法获取新服务器上的内容。

    1261
    • 不收录原因
  • TrustRank域名信任度

    TrustRank域名信任度

    TrustRank域名信任度?由于搜索引擎在计算网页排名的时候,非常依赖连接,而且连接的质量越来越显得重要。由于搜索引擎在计算网页排名的时候,非常依赖连接,而且连接的质量越来越显得重要。在这种情况下,需要对连接的来源站点质量进行判断。更重要的是,以前依靠连接和相关性来决定排名的方式,

    1843
    • TrustRank域名信任度
  • 百度天网算法,用户隐私保护

    百度天网算法,用户隐私保护

    百度天网算法打击恶意盗取网民的QQ号、手机号进行营销推广的行为。打击这种严重侵犯用户隐私的行为的站点。

    1347
    • 百度天网算法
    • 用户隐私保护
  • 百度快照与权重的关系

    权重,百度快照

    百度快照与权重的关系,事实上百度快照并不能反映出搜索引擎蜘蛛抓取网站数据的时间,更不能决定页面的权重。所以大家不必过度的关注百度快照

    1406
    • 权重
    • 百度快照
  • seo优化是什么意思?

    seo优化

    什么是SEO优化,SEO(Search Engine Optimization)搜索引擎优化,通过利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名,是一种不消耗额外广告费的一种推广手。

    774
    • seo优化
  • 做SEO前必须知道的那些事

    SEO优化

    入SEO者常有,而有效果者不常有,想要做好SEO获得效果,那么在做SEO前必须知道的这些事。在这个内卷的时代,广告费用节节攀升的情景下;再加上这些年来SEM付费广告的出现的一些负面事件,导致越来越多的人对搜索引擎的付费广告比较反感;这使得SEO的价值还在不断地提升。

    237
    • SEO优化
  • 代码适配对百度友好代码详解

    代码适配

    移动端适配的方式有多种形式,比如通过规则适配、响应式、独立移动PC站等方式都可以实现PC移动端适配的效果,今天详细讲一下本人比较喜欢的适配方式即代码适配,这种适配方式可以说是尽可能的结合了上面集中适配方式的优点,对于SEO优化来说还是比较友好的。

    2440
    • 代码适配
  • 什么是反向链接,及其作用

    什么是反向链接

    什么是反向链接,及其作用对于SEO优化中起着什么作用呢?反向链接的种类非常的多,只要满足上述指向关系。比如常见的友情链接、网页目录、外部链接等等都可以认定是外链形式的反向链接。

    2316
    • 什么是反向链接
  • 老域名建站对seo真的有好处吗

    老域名建站,seo优化,新站考核期

    很多站点的时候会选用权重高的老域名,可以获得更好的效果,但是事实真的是这样吗?老域名建站大部分的情况下不但没有正向作用,还会有负面的作用,那么老域名建站需要注意哪些方面呢?

    852
    • 老域名建站
    • seo优化
    • 新站考核期
  • 手机移动端该怎么优化?

    手机移动端优化

    手机移动端该怎么优化?移动互联网的推出,各位站长也纷纷的挤入了移动化网站,移动网站可以说是一个比一个做的漂亮,那么既然做了移动化的网站,那少不了的自然是SEO优化,在PC端上你的网站可能在某个词上有排名,但在移动搜索引擎上,未必你会优先排名展现。

    1160
    • 手机移动端优化
  • 什么是面包屑导航

    面包屑导航

    什么是面包屑导航,使用面包屑导航的优点,面包屑导航的作用是告诉访问者他们目前在网站中的位置以及如何返回。

    779
    • 面包屑导航
  • 新站不收录怎么办,如何快速收录

    新站不收录解决方法

    对于新网站来说收录是一个比较困难的,相信很多SEO们都会遇到。分享一下如何让新站可以实现一个月 不到就开始稳定快速收录,以及新站建站中需要注意的哪些坑.....

    2469
    • 新站不收录解决方法
  • 移动端适配解决方案

    移动端适配

    随着移动互联网的不断发展,在某些领域移动端的流量已经远超PC端,因此越来越多的站点开始重视移动端的优化,如何把移动端和PC端进行结合,对于SEO优化是一个非常重要的问题。移动适配的方案有很多,选择合适的移动适配解决方案是非常的重要的。

    920
    • 移动端适配
  • 如何分配抓取频次?

    如何分配抓取频次?

    如何分配抓取频次?随着搜索引擎优化,我们不完全知道搜索引擎如何形成网站的爬行频次,所有博主对网络的内容进行整理得到搜索引擎利用以下两个因素来确定爬网频次。

    5413
    • 如何分配抓取频次?
  • 必应搜索引擎如何进行手动URL提交

    URL提交,必应

    必应搜索引擎找不要手动URL提交入口的速度来看解决方案。如何在必应搜索引擎上提交站点的URL链接呢?有很多小伙伴反馈,在必应站长工具后台找不到手动提交URL的入口,今天潘某人SEO就来分享下,如何在必应搜索引擎站长后台进行手动URL连接的提交。

    223
    • URL提交
    • 必应
  • https网站对排名有好处吗?

    HTTPS与SEO优化

    最近几年https开始出现在我们眼前,越来越多的网站开始从http协议升级为HTTPS协议,那么站在网站SEO优化的角度,https对于网站的排名等各项指标是否能提供帮助呢?那么我们就需要先了解https协议于传统http的区别,那么你到时候就自然明白了https到底会与会影响SEO优化。

    1218
    • HTTPS与SEO优化
  • 搜索引擎的基础原理知识

    搜索引擎原理

    搜索引擎的基础知识,从抓取、过滤筛选、建立索引及输出结果,这几个步骤的工作原理。对于SEO优化来说如果连搜索引擎的基本工作原理都不清楚,这样是一件非常糟糕的事情。

    992
    • 搜索引擎原理
-- 这已经是底线了,看看别的把! --