这样,假定某个网络包含n个网页,每个网页用一个数字k标记, 。则该网络可以用一个有向图来表示,其中每个顶点看成是一个网页,边(箭头)表示从一个网页到另一个网页的链接。 当网页j 上有连到网页i的链接,则称网页j为网页i的导入链接,而称网页i为网页j 的导出链接。 比如,图1就可以看成是一个包含5个网页8个链接的小型网络,其中网页3有3个导入链接。本文来自辣%文,论'文.网,
毕业论文 www.751com.cn
3.1.2邻接矩阵
有向图 的邻接矩阵为 ,其中
(14)
对于图1所示的有向图,其邻接矩阵为
我们用 表示某个网络中第k个网页的重要性, 是一个非负的正数,若 则表示第i个网页的重要性大于第j个网页的重要性。
3.1.3特征值和特征向量
我们知道,在有限文线性空间中,取了一组基之后,线性变换就可以用矩阵来表示。为了利用矩阵来研究线性变换,对于每个给定的线性变换,我们希望能找到一组基使得它的矩阵具有最简单的形式。特征值和特征向量对于线性变换的研究具有基本的重要性。
设A是数域P上线性空间V的一个线性变换,如果对于数域P中一数 ,存在一个非零向量 ,使得
(15)
那么 称为A的一个特征值,而 称为A的属于特征值 的一个特征向量。
从几何上来看,特征向量的方向经过线性变换后,保持在同一条直线上,这时或者方向不变( ),或者方向相反( ),至于 时,特征向量就被线性变换成0。
如果 是线性变换A的属于特征值 的特征向量,那么 的任何一个非零倍数 也是A的属于 的特征向量。因为从(1)式可以推出
这说明特征向量不是被特征值所唯一决定的。相反,特征值却是被特征向量所唯一决定的,因为,一个特征向量只能属于一个特征值。
3.1.4马尔可夫链
从有向图表S的状态i出发,将有限时间之后再次回复到状态i的概率作为1时,也就是说,当沿着(有向)图表的方向前进能够回到原来位置的路径存在的时候i就被称为回归。不能回归的状态被称为非回归。从状态i出发,当通过有限次数的推移达到状态j的概率非负的时候,我们就说“从状态i到状态j是可能的”。当反方向也可能到达的时候,我们称“i和j互相可能到达”。从状态i不能到达其他任何状态的时候,称i为“吸收状态”。
从邻接行列A所决定的图表的任意顶点出发,指向其他任意的顶点图表的路径能够像箭头那样到达时被称为“强链接”(也被称为“分解不能”)。强链接,等价于从任意状态到任意状态可以互相抵达。邻接行列A的成分中有很多0时,强链接性就会有问题。注意,如果全部成分都为 的话,则都属于强链接。因为,对应的马尔可夫链的样本路径表示S的任意两点间以正的概率来往通行。
我们可以把全体状态以等价类(或者回归类)来划分。在这里,回归类是指链接所围成的范围。属于一个等价类的状态可以互相到达。从一个类出发以正的概率进入到其他的类的可能性也是存在的。可是很明显,在这种情况下不可能回复到原来的类,不然的话,这两个类都归于等价类了。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] 下一页
网页排名PageRank算法初探+数学建模与求解 第4页下载如图片无法显示或论文不完整,请联系qq752018766