【概念】PageRank算法了解

论坛 期权论坛 区块链     
辰昇   2018-11-20 23:30   2525   0
            “币探区块链”让非专业的人更专业的了解,让专业的人更懂区块链
PageRank网页排名,又称网页级别、佩奇排名,是一种根据网页之间相互的超链接计算的技术,用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度。而作为网页排名的要素之一,以Google创始人拉里佩奇(LarryPage)之姓来命名。它由Larry Page 和Sergey Brin在20世纪90年代后期发明。PageRank实现了将链接价值概念作为排名因素。PageRank将对页面的链接看成投票,指示了重要性。

最早的搜索引擎采用的是分类目录的方法,即通过人工进行网页分类并整理出高质量的网站。那时 Yahoo 和国内的 hao123 使用的就是这种方法。后来网页越来越多,人工分类已经不现实了。搜索引擎进入了文本检索的时代,即计算用户查询关键词与网页内容的相关程度来返回搜索结果。这种方法突破了数量的限制,但是搜索结果不是很好。因为总有某些网页来回地倒腾某些关键词使自己的搜索排名靠前。

谷歌的两位创始人,当时还是美国斯坦福大学研究生的佩奇 (Larry Page) 和布林 (Sergey Brin) 开始了对网页排序问题的研究。他们的借鉴了学术界评判学术论文重要性的通用方法,那就是看论文的引用次数。由此想到网页的重要性也可以根据这种方法来评价。于是PageRank的核心思想就诞生了,非常简单:
1.如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高
2.如果一个PageRank值很高的网页链接到一个其他的网页,那么被链接到的网页的PageRank值会相应地因此而提高
谷歌用PR值来划分网页的等级,有0~10级,一般4级以上的都是比较好的网页了。如今PR值虽不如以前重要了(没有区分页面内的导航链接、广告链接和功能链接导致PR值本身能够反映出的网页价值不精确,并且对新网页不友好),但是流量交易里PR值还是个很重要的参考因素。
参考文献:
[1] 维基百科.PageRank[DB/CD].维基百科
[2] 百度百科.google pagerank[DB/CD].百度百科
[3] 刀刀流.PageRank算法--从原理到实现[DB/CD].博客园.2016
         
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:79
帖子:3
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP