模板建站
培恋网博客
企业动态 技术分享 行业动态

东莞网络推广SEO中的hits算法理解

seo2023-04-20模板建站分享网站建设网站建设培恋网博客 模板网站优化 seo网站建设 培恋网博客
 东莞网络推广SEO中的hits算法理解
 
    在HITS算法中,第一步是将结果集检索到搜索查询。计算仅在此结果集上执行,而不是在所有网页上执行。
 
  权限和中心值在相互递归中相互定义。权限值计算为指向该页面的缩放中心值的总和。集线器值是它指向的页面的缩放权限值的总和。一些实现还考虑链接页面的相关性。
 
  该算法执行一系列迭代,每个迭代包含两个基本步骤:权限更新:将每个节点的权限分数更新为等于指向它的每个节点的中心分数之和。也就是说,通过被识别为用于信息的集线器的页面链接,节点被赋予高权限分数。
 
  集线器更新:将每个节点的集线器分数更新为等于其指向的每个节点的权限分数之和。也就是说,通过连接到被认为是主题上的权限的节点,给予节点高的中心分数。
 
  使用以下算法计算节点的中心分数和权限分数:
东莞网络推广
 
东莞seo
 
  从具有中心分数和权限分数为1的每个节点开始。运行Authority Update Rule运行集线器更新规则通过将每个Hub得分除以所有Hub得分的平方和,并将每个权威得分除以所有权限得分的平方和,来标准化值。必要时从第二步开始重复。
 
  HITS,如Page和Brin的PageRank,是一种基于Web上文档链接的迭代算法。但它确实有一些重大差异:
 
  它在查询时执行,而不是在索引时执行,并伴随查询时处理的相关性能命中。因此,分配给页面的中心和权限分数是特定于查询的。它并不常用于搜索引擎。(虽然据说Teoma [1]使用了类似的算法,但Ask.com已将其收购。)它计算每个文档,中心和权限两个分数,而不是单个分数。
 
  它是在一小部分“相关”文档上处理的,而不是像PageRank那样的所有文档。HITS算法在提出的时候运行良好,已经提出了几种基于HITS的算法。然而原始的HITS算法和基于HITS的算法不再适用
 
  今天的网络由于垃圾邮件链接的增加。几种查找垃圾邮件的方法。最近已经开发了链接但它们需要太大的数据使用PC按需执行的页面。例如,提出的方法需要页面内容的数据,这些数据很多大于HITS算法使用的页面链接数据。在本文中,我们首先提出了三种使用网络查找链接规则的方法信息; 
 
linkfarm是一组垃圾链接,形成Web图的密集连接的子图; Web图是一个有向图,其顶点集是一组网页,其边缘集是页面之间的一组链接。我们的方法找到比吴和戴维森[14]提出的方法更多的链接法。然后,我们提出了一种信任评分算法,以便为不是垃圾邮件页面的页面提供高分通过扩展TrustRank算法使用的思想,概率很高。然后我们构建四个评分算法;第一个是通过我们的信任评分算法与Bharat和Barerat提出的BHITS算法相结合得到的Henzinger ;剩下的三个是通过组合我们三个中的每一个获得的使用trust-score算法和BHITS查找linkfarms的方法。我们最终通过实验评估我们的算法和几个基于HITS的算法。
 
  为了评估各种评分算法,我们使用“前十名的质量”当局“通过算法找到给定主题;十大权威机构是算法给出的十大高分的页面,十大权威的质量是通过与主题相关的页面数量来衡量的十个当局,因此十大权威的质量最多为十个。我们通过计算实验检验十大权威的质量十四个主题。对于几乎所有主题,我们的算法找到十大权威质量高于现有算法的质量。特别是其中之一我们的算法,称为TaN + BHITS,采用信任得分算法和a使用名称服务器查找linkfarm的方法,找到了前十个权限最佳平均质量8.79,而现有算法找到前十名平均质量最多3.07
 

培恋网原创版权,网站建设提供网站代运营、模板网站制作转载请注明出处,本文地址:https://www.xiaopeijx.com/news/video/63.html

培恋网网站模板 培恋网 网站模板
培恋网咨询在线咨询
Copyright © 2002-2019 培恋网 版权所有 东莞网站地图 网站相关链接:|SEO优化技巧|成都seo优化| 粤ICP备17138810号