毕业论文论文范文课程设计实践报告法律论文英语论文教学论文医学论文农学论文艺术论文行政论文管理论文计算机安全
您现在的位置: 毕业论文 >> 报告 >> 正文

网页排名PageRank算法初探+数学建模与求解 第5页

更新时间:2016-10-23:  来源:毕业论文
4 符号说明
  :特征值;
 :某个网络中第k个网页重要性;
 : 加权因子;
5 数学建模与求解
5.1 PageRank算法原理及其应用
一种简单的衡量某个网页重要性的方法是看谁的导入链接最多. 由图1可得: , , , , . 从而得到第3个网页的重要性最大,第2,4个网页的重要性其次,而第1,5个网页的重要性最小.
然而上述排名算法显然不能令人满意,它不能区分第2,第4两个网页和第1,第5两个网页哪个更重要. 一种改进的做法是除了考虑导入链接的数量外,还应考虑导入链接的质量,即来自一个重要性相对较高网页的链接可以增加该网页的重要性. 用数学语言可表达如下:
PageRank是基于(从许多优质的网页链接过来的网页,必定还是优质网页)的回归关系,来判定所有网页的重要性的。
PageRank,有效的利用了Web所拥有的庞大的链接构造的特性。从网页A导向网页B的链接被看做是对页面A对页面B的支持投票,Google根据这个投票数来判断页面的重要性。可是Google不单单只看投票数(即连接数),对投票的页面也进行分析。重要性高的页面所投的票的评价会更高,因为接受这个投票的页面会被理解为“重要的物品”。
根据这样的分析,得到了高评价的重要页面会被给予较高的PageRank(网页等级),在检索结果内的名次也会提高。PageRank是Google中表示网页重要性的综合性标志。而且不会受到各种检索(引擎)的影响。倒不如说,PageRank就是基于对“使用复杂的算法而得到的链接构造”的分析,从而得出的各网页本身的特性。
例如,由图1所示的小型网络,可得:
 
利用MATLAB:在命令窗口键入:
 A=[0 0.5 0 0 0;0.5 0 1 0 0;0.5 0 0 0.5 0.5;0 0.5 0 0 0.5;0 0 0 0.5 0];
[V,D]=eig(A);
diag(D)
就得到矩阵A的所有特征值,包括特征值1. 再键入
 abs(V(:,1))/norm(V(:,1),1)
则可以得到A对应于特征根1的归一化特征向量.
 
这说明按照上述方法的网页排名为: 。
然而,上述方法仍然存在以下不足:
(1)若网络中存在导出链接数为0的网页,则链接矩阵A中必存在某列全为0。 此时,可验证A的所有特征值的模都小于等于1,且1不一定是A的特征值。
我们来考察由图2所示的小型网络,易见网页3无导出链接

上一页  [1] [2] [3] [4] [5] [6] [7] [8] 下一页

网页排名PageRank算法初探+数学建模与求解 第5页下载如图片无法显示或论文不完整,请联系qq752018766
设为首页 | 联系站长 | 友情链接 | 网站地图 |

copyright©751com.cn 辣文论文网 严禁转载
如果本毕业论文网损害了您的利益或者侵犯了您的权利,请及时联系,我们一定会及时改正。