1.4 论文研究主要内容
本次课题主要针对Google的网络搜索引擎进行研究。课题主要内容是通过线性代数的一些知识,通过搜索引擎的排名算法介绍了正矩阵,列随机矩阵的一些性质,特征值与特征向量的关系以及用于计算矩阵特征值的幂迭代法。
1.4.1简化的PageRank算法
若网页j包含 个导出链接,其中的某个链接到了网页k (即第k个网页),则该链赋给网页k的重要性为 ,即网页j的重要性被平分到其每个导出链接上. 本文来自辣%文,论'文.网,
毕业论文 www.751com.cn 令 (注意这里的数字是表示网页的标记)为链接到网页k的那些网页的集合,则网页k的重要性可以由下式得到
(1)
如果引进矩阵A称为链接矩阵,其元素
那么(1)式等价于 ,也即等价于矩阵方程
(2)
其中 .
不难验证:
其中 为邻接矩阵, 为对角矩阵.
注意方程(2)的解就是矩阵A对应于特征根1的特征向量,若规定 ,则对应的解就是矩阵A对应于特征根1的归一化特征向量。
1.4.2改进的PageRank算法
只要对(1)式稍作改动,就可以解决由于网页重要性相等而无法确定排名的问题。
令n表示网络中包含的网页数,p称为加权因子其取值在0和1之间。则网页k的重要性可以由下式给出:
(3)
上式亦可以用如下形式的矩阵方程来表示:
(4)
其中s是一个元素全为 的列向量. 若规定 并记S是一个元素全为 的n阶方阵,则由 可得:
(5)
关于矩阵方程(3),可以证明:若A是列随机矩阵,则M亦是列随机矩阵。在 的约束条件下,上述方程有唯一解. 其解为矩阵M特征根1所对应的归一化特征向量。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] 下一页
网页排名PageRank算法初探+数学建模与求解 第2页下载如图片无法显示或论文不完整,请联系qq752018766