图4
根据改进的PageRank算法计算出他的网页排名:
p=0.85;
A=[0 0 1 0.5;1/3 0 0 0;1/3 0.5 0 0.5;1/3 0.5 0 0];
S=ones(4,4)/4;
M=p*A+(1-p)*S;
[V,D]=eig(M);
diag(D);
abs(V(:,1))/norm(V(:,1),1)
ans =
0.3682
0.1418
0.2880
0.2021
即
可以看到对于图4我们只是在图2的基础上添加了一条由网页3链接到网页1的链接,但是结果却使得网页1的重要性从原先的排第3一下就排到了首席。那么这一现象又说明了什么呢?
首先将PageRank的评价按顺序排列,为了下面能够更好的说明一下问题,首先将图1所得评价列了一个表,
表2
名次 PageRank 文件ID 发出链接ID 被链接ID
1 0.3077 2 1,4 1,3
2 0.2308 3 2 1,4,5
3 0.2051 4 3,5 2,5
4 0.1538 1 1,3 2
5 0.1026 5 3,4 4
表3
名次 PageRank 文件ID 发出链接ID 被链接ID
1 0.3979 3 1,2,4
2 0.2423 4 1,3 1,2
3 0.2123 1 2,3,4 4
4 0.1475 2 3,4 1
表4
名次 PageRank 文件ID 发出链接ID 被链接ID
1 0.3682 1 2,3,4 3,4
2 0.2880 3 1,2,4
3 0.2021 4 1,3 1,2
4 0.1418 2 3,4 1
首先由表3应该关注的是,PageRank的名次和反向链接的数目是基本一致的。无论链接多少正向链接都几乎不会影响PageRank,相反地有多少反向链接却是从根本上决定PageRank的大小。但是仅仅这些并不能说明表2中第1位和第3位之间的显著差别(同样的第4位和第5位的差别)。也就是说PageRank并不只是通过反向链接来决定的。
通过观察发现,ID2的文件的PageRank是0.3077,占全体的三分之一,成为第一位,值得注意的是起到相当大效果的是从排在第2位的ID3页面中的所有PageRank数,ID3页面有从3个地方过来的反向链接,而只有面向ID2页面的一个链接,因此链接就得到了所有的PageRank数。由此我们可以看出提高PageRank的要点,大致有3个:本文来自辣%文,论'文.网,毕业论文 www.751com.cn
(1)反向链接数
(2)反向链接是否来自推荐度高的页面
(3)反向链接页面的链接数
打个比方,同样的2个人被不同的2个人所推荐的话,其中一个是被资历和资质比较高外界评价也比较好的人所推荐,而另一个则是被外界评价一般甚至是评价比较差的人所推荐,那么自然前者所获的评价就要略高于后者。图4正是应验了这一道理。
上一页 [1] [2] [3] [4] [5] [6] [7] [8]