作者:

Google PR算法

一、简单算法:
例如一个由4个页面组成的小团体:A,B, C 和 D。如果所有页面都链向A,那么A的PR(PageRank)值将是B,C 及 D的和。

PR(A) = PR(B) + PR(C) + PR(D)

继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的 PageRank 上。

风采依扬觉得,根据链处总数平分一个页面的PR值。

最后,所有这些被换算为一个百分比再乘上一个系数q。由于下面的算法,没有页面的PageRank会是0。所以,Google通过数学系统给了每个页面一个最小值1 − q。

所以一个页面的 PageRank 是由其他页面的PageRank计算得到。Google 不断的重复计算每个页面的 PageRank。如果您给每个页面一个随机 PageRank 值(非0),那么经过不断的重复计算,这些页面的 PR 值会趋向于正常和稳定。这就是搜索引擎使用它的原因。

二、完整的算法:

这个方程式引入了随机浏览的概念,即有人上网无聊随机打开一些页面,点一些链接。一个页面的PageRank值也影响了它被随机浏览的概率。为了便于理解,这里假设上网者不断点网页上的链接,最终到了一个没有任何链出页面的网页,这时候上网者会随机到另外的网页开始浏览。

为了对那些有链出的页面公平,q = 0.15(q的意义见上文)的算法被用到了所有页面上, 估算页面可能被上网者放入书签的概率。

所以,这个等式如下:

p1,p2,…,pN是被研究的页面,M(pi)是链入pi页面的数量,L(pj)是pj链出页面的数量,而N是所有页面的数量

PageRank值是一个特殊矩阵中的特征向量。这个特征向量为

R是等式的答案

如果pj不链向pi, 而且对每个j都成立时,等于 0

这项技术主要的弊端是,旧的页面等级会比新页面高,因为新页面,即使是非常好的页面,也不会有很多链接,除非他是一个站点的子站点。

这就是 PageRank 需要多项算法结合的原因。之前石头也说了wikipedia.com在google的一些关键词内表现很好整体的访问量超过一些门户网站,另一方面也是数万网民的共同努力。

Google对维基百科情有独钟之一,风采依扬想应该是:PageRank 似乎倾向于维基百科页面,在条目名称的搜索结果中总在大多数或者其他所有页面之前。原因主要是维基百科内相互的链接很多,并且有很多站点链入。

Google 经常处罚恶意提高 PageRank 的行为。Google 究竟怎样区分正常的链接交换和不正常的链接堆积仍然是商业机密。

相信看完以上内容后对PageRank了解更深入。

我们可以知道搜索引擎用来评估网页质量的一种方法,就是PageRank,它经常被用来当作对Google搜索引擎网页要素评分之一。

你可以找到任何网页的PageRank分数,通过使用你的浏览器去浏览网页,并下载GOOGLE工具栏。将你的鼠标放在绿色的PageRank栏 上,马上就会显示出一个从0到10之间的数字,这就是PageRank值,是google对该页面的重要性的分配。工具栏按照PageRank比例范围显 示出网页的PageRank,但是在现在的PageRank算法中就是不单单是0到10的数据了,在google的服务器中,PageRank的分配数有 可能是0精确到100,甚至是到1000的数值。

PageRank是平均每三个月更新一次的,它不是按照一般的线性刻度计算,而是按照一种指数刻度。这是一种非常繁杂的数学术语(之前文章也有提 到),意思是PageRank4不是比PageRank3好一级—而是会好6到7倍。因此一个PageRank5的网页和PageRank8的网页之间的 差距会比你可能认为的要大很多。

PageRank值在这几天要更新了,我们谈谈现在PR的算法吧!当一个网页链接到你的网页时,搜索引擎是怎样转移这个网页的权威性到你的网站的 (也就是PageRank的转移)。因此你希望从有最高PageRank得分的网页上获得链接,去不断的寻找高PR的站点,是不是呢?

这种方式在以前还管用,但是现在实际情况比这复杂了很多,一个权威性的转移与网页上存在的链接数量有关—链接越少,每个链接所转移的权威性就越高, 因些,通常PageRank5网页上唯一的链接要比PageRank7上一百个链接中的一个要有价值。当然这也是有前提的,就是站于站之间的链接内容相似 度要高一些。
如:
A(SEO资料站)站同时链向B(SEO服务网站)、C(企业服装网站)
那么A站的PageRank转移到B、C那个站所得的分高呢,在众多的实验证明B站获得A站的PR转移得分比C站高,原因很简单:A、B二站的相似度很高,所得的得分也自然高。

之前所讲的大家都知道PR值的重要性,但是真的一提的是,不要落入PageRank的诱惑陷阱中。对于你的网页来说,最重要的是被链接到那些能为你 的站点带来流量的站点,而不是见到PageRank就链。要将PageRank作为工具来验证你自己对一个潜在链接来源质量判断,而不要在做你的链接来源 列表时盲目跟从PageRank。

发表评论

评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据