首页 >  SEO >  SEO算法 >  正文

链接权重分析HITS算法的不足之处

 作者:潘某人SEO
1998

理解HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。HITS(Hypertext-InducedTopic Search)算法是利用Web的链接结构进行挖掘典型算法,其核心思想是建立在页面链接关系的基础上,对链接结构的改进算法。HITS算法通过两个评价权值——内容权威度(Authority)和链接权威度(Hub)来对网页质量进行评估。其基本思想是利用页面之间的引用链来挖掘隐含在其中的有用信息(如权威性),具有计算简单且效率高的特点。HITS算法认为对每一个网页应该将其内容权威度和链接权威度分开来考虑,在对网页内容权威度做出评价的基础上再对页面的链接权威度进行评价,然后给出该页面的综合评价。内容权威度与网页自身直接提供内容信息的质量相关,被越多网页所引用的网页,其内容权威度越高;链接权威度与网页提供的超链接页面的质量相关,引用越多高质量页面的网页,其链接权威度越高。

首先,它完全将网页的内容或文本排除在外,仅考虑网页之间的链接结构来分析页面的权威性,这与现实网络中的权威页面相比,其不科学性显而易见。 然而HITS算法也有其明显的不足。因为权威页面必须针对某一主题或关键词而言。例如某一页面对一确定主题具有较大权威性,但这并不意味在其他与其无关的主题方面同样具有权威性。其次一个页面对另一页面的引用有多种情况,其中包含了一页面对另一页面的认可,但除此之外也有其他目的链接,如为了导航或为了付费广告。就HITS算法的思想与实现过程做了细致的研究与概括。而HITS算法在实现过程中均没有考虑以上情况.导致了结果与目标的差距。


HITS算法的不足之处


对HITS算法的第二个不足,即非正常目的的引用.在HITS算法看来,也误认为是正常引用,导致实际结果与目标的出入。针对前面第一种不足,就有相关的学者提出了一种利用超链文字及其周围文字与关键字相匹配而计算超链权值的方法,并引入系数对周围文字和超链文字进行权值的相对控制,很好地将页面文本信息引入到HITS算法,提高了算法的可靠性,并在现实中取得了很好的效果。

后来,经过不断的改进。HITS算法又引入了时间参数,即利用对一链接引用的时间长短来评价是否为正常引用。因为非正常链接其引用时间肯定不会很长(如交换链接、广告链接),相反,如果一页面对另一页面的链接时间较长,则必然反映此页面就是用户的寻找页面。即目标页面或至少是正常引用。

如设定访问时间少于1分钟者为非正常引用。如果设定时间阀值,则可以将非正常引用的链接在HITS算法的实现过程中筛选出来。另外可构造时间访问函数,控制权威页面的相对大小。如随访问时间的增大而其权威性也逐渐非线性增大.这样可为HITS算法的权威页面提供更合理、更科学的解释。

申明:以上内容仅代表个人观点,仅供学习参考 本站图片来源于站点原创或CC0协议图库站点或已获得VRF授权的图库站点 本文参考于互联网如有侵权,请联系 pmrseo@foxmail.com删除 本文地址:https://www.chateach.com/seo/seosuanfa/386
相关文章
  • SEO优化检测工具有哪些

    SEO工具

    SEO优化检测工具有哪些?网站建成之后,我们往往还要进行SEO的优化工作。但是,怎么检查您的网站的SEO优化是否符合相关的技术标准呢?那么就需要配合第三方的SEO检测工具来帮助您检查。

    3749
    • SEO工具
  • 如何更新或删除百度快照

    百度快照更新

    很多人在优化的过程中想要去更新或者删除百度快照,但是碍于自己还是新手,实战经验不是很丰富,不懂得如何去操作,今天我给大家简单的分享一下。有时候,我们对网站进行了改版,修改了标题、描述等等,这个时候我们想要更新百度快照,让快照尽快更新过来,或者让标题、描述快速更新过来,怎么办?

    1946
    • 百度快照更新
  • 网站改版301跳转,你踩坑了吗?

    301跳转,重定向,网站改版

    当网站改版时,新旧页面的链接地址或者是网站域名发生变化时,就需要在对应的搜索引擎提交网站改版规则,然后在做301跳转,这是网站的常规操作,相信大多数都知道,但是你真的觉得这么简单吗?

    533
    • 301跳转
    • 重定向
    • 网站改版
  • 如何找到有效的关键词?

    有效关键词

    如何找到有效的关键词? 关键词对电商卖家来说,非常重要。它能给listing带来流量,帮助刺激销量。那么,如何寻找合适的关键词呢?

    1202
    • 有效关键词
  • SEO网站页面性能优化指南

    网站页面速度优化

    SEO网站页面性能优化指南,慢速主要原因: 1、关键子资源耗时较严重; 2、页面存在额外跳转; 3、主文档耗时较为严重。页面打开速度直接的影响着转化的水平

    1722
    • 网站页面速度优化
  • 如何防止假蜘蛛抓取内容

    假蜘蛛,防采集,原创保护

    如何让网站自动识别蜘蛛的真假,如何自动的屏蔽假蜘蛛抓取网站内容,从而更好的保护网站的原创内容呢?

    1634
    • 假蜘蛛
    • 防采集
    • 原创保护
  • 原创内容收录排名一定好吗?

    原创内容收录

    可以说现在已经已经进入了内容为王的时代,站点想要流量就必须生产优质内容,逐渐的大家都在进行原创或者为原创,但是很多站点并没有多大的效果,甚至有的站点收录都非常困难。

    840
    • 原创内容收录
  • 网站seo如何正确设置基础信息

    seo,基础信息

    什么是搜索展现基础信息、标题设置规范、摘要设置规范、站点名设置规范、配图设置规范、时间因子设置规范以及网站内容设置注意事项,详细讲解如何正确设置基础信息。用户在百度搜索引擎中根据自身的搜索需求输入关键词,从得到的搜索结果中,筛选出符合需求的内容,产生点击行为。

    794
    • seo
    • 基础信息
  • UGC是什么意思,对于SEO优化的作用

    UGC,SEO优化

    UGC是什么意思,对于SEO优化的作用,UGC 互联网术语,全称为User Generated Content,也就是用户生成内容,即用户原创内容。

    1110
    • UGC
    • SEO优化
  • 网站采集对seo优化有哪些影响

    采集对于SEO的影响

    网站采集对seo优化有哪些影响,百度有飓风算法就是针对于网站内容采集的。那么我们作为站长应该是如何采集文章效果号,有效提高我们网站的内容建设。

    2010
    • 采集对于SEO的影响
  • 百度落地页时间因子什么作用

    如何保护原创内容,百度时间因子

    如果你是一个SEO优化人员但是不知道百度着陆页时间因子,但是绝对是一大损失,百度时间因子可以很好保护中小站点的原创内容,保护站点的权益。

    2620
    • 如何保护原创内容
    • 百度时间因子
  • 网站被人刷点击有影响吗

    刷点击影响排名

    网站被人刷点击有影响吗?通过低质量高跳出率的去刷取竞争对手的网站,使它被搜索引擎认定为作弊行为来打击竞争对手的网站。那么通过这种恶意的刷对方的网站真的会可以是他降权吗?

    1886
    • 刷点击影响排名
  • 做seo常用的4个标签

    SEO常用标签

    在做seo的时候,经常会碰到网站页面的标签的使用问题,这些标签你不得不好好对待。因为这些标签可以帮助日后的网站优化,并且很有利于提高网站权重。那么下面就和你说下做seo常用的4个标签:

    1450
    • SEO常用标签
  • 网站移动端网页适配那种方式好呢?

    移动适配

    网站移动端网页适配那种方式好呢?何规划移动端,是自适应的方式,还是独立移动站点的方法,会在SEO优化上面具有更大的优势呢?

    1236
    • 移动适配
  • a标签怎么写对seo更友好

    a标签如何优化

    拿比较重要的<a>标签来探讨下,相信大家对于<a>标签是十分的熟悉的,链接是互联网之所以能成为一张网的基本条件,并且对于SEO优化起着十分重要的影响,<a>标签优化的到不到位对于SEO效果的影响,

    3671
    • a标签如何优化
  • 通过时效性内容提高网站收录速度

    时效性内容收录

    通过时效性内容提高网站收录速度是一个不错的方法,但是你知道如何保护自己的原创内容不被别人抄袭还比你更快收录吗?一种提高内容收录及更新抓取速度的方法。

    1503
    • 时效性内容收录
  • SEO优化之网站速度优化

    SEO优化,网站速度

    网站加载速度优化是非常有必要的,不仅仅是对于SEO优化,对于用户的访问转化起到了决定性的作用,看来看看有哪些因素会影响网站速度吧!

    539
    • SEO优化
    • 网站速度
  • 关于惊雷算法的要点解读

    惊雷算法解读

    惊雷算与1.0不同的是针对恶意链接的问题提出了整顿,下面让我们带你一起解读。对这个情况进行说明:针对恶意了知道作弊超链、恶意刷点击的作弊行为进行了算法的再次升级。

    1642
    • 惊雷算法解读
-- 这已经是底线了,看看别的把! --