我们对任意一个网页P,以I(P)来 表述其重要性,并称之为网页的网页排序。在很多网站,你可以找到一个近似的网页排序值。(例如,美国数学会的首页目前的网页排序值为8,最高分是10。你 可以试试找到一个网页排序值为10的网页吗?)这个网页排序值仅是一个近似值,因为谷歌拒绝提供真实的网页排序值,以阻止那些试图干扰排序的行为。
网页排序是这样确定的。假定网页Pj有lj个链接。如果这些链接中的一个链接到网页Pi,那么网页Pj将会将其重要性的1/lj赋给Pi。网页Pi的重要性就是所有指向这个网页的其他网页所贡献的重要性的加和。换言之,如果我们记链接到网页Pi的网页集合为Bi,那么
I(Pi)=∑Pj∈BiI(Pj)Ij.
这或许让你想起“先有鸡还是先有蛋”的问题:为了确定一个网页的重要性,我们首先得知道所有指向它的其他网页的重要性。然而,我们可将这个问题改写为一个更数学化的问题。
立模型
首先建立一个矩阵,称为超链矩阵(hyperlink matrix),H=[Hij],其中第i行第j列的元素为
Hij=???1lj 0如果Pj∈Bi上述条件不成立.
注意到H有一些特殊的性质。首先,它所有的元都是非负的。其次,除非对应这一列的网页没有任何链接,它的每一列的和为1。所有元均非负且列和为1的矩阵称为随机矩阵,随机矩阵将在下述内容中起到重要作用。
我们还需要定义向量I=[I(Pi)],它的元素为所有网页的网页排序——重要性的排序值。前面定义的网页排序可以表述为
I=HI.
换言之,向量I是矩阵H对应特征值1的特征向量。我们也称之为矩阵H的平稳向量(stationary vector)。
让我们来看一个例子。下图所示为一个网页集合(8个),箭头表示链接。
其相应的矩阵为
这说明网页8的受欢迎程度最高。下图是阴影化的图,其中网页排序值越高的网页阴影越浅。
通过实例得证
2、微博营销(1)概论
据统计,新浪微博的用户群早已达到惊人的两亿,腾讯微博也不例外。显然,随着微薄用户群的不断扩展,微博已经成为全国甚至全世界最时尚、最具人气、最热门的社交工具。我们在大街上、公交车、餐桌上、课室里、家里、办公室都能看到一群年轻人在拿着手机玩微博,可想而知微博的影响力有多大,它已经成为部分年轻人日常生活的一部分。只要有人的地方,就能推广,微博这么大的蛋糕,能不让商家们垂涎三尺么!许多站长们也从中看到了利益,迅速抓住这个潮流来做微博推广。的确,微博推广如果做得好,能带来相当大的流量和利益,还能获得用户的资料从而优化用户体验,那么,微博推广要怎样才能做好呢?
影响微博影响力的因素 (2 )问题提出和分析
目前所拥有的数据是100位微博用户的对微博主影响力产生影响的基本微博信息和在两周时间内一定微博数量的转发、评论次数,以这些数据来分析各因素与微博主的微博影响力之间的关系。
由于样本容量较少,而影响变量过多。考虑到直接进行多元回归分析建立模型。而直接建立模型可能存在伪回归的风险,所以采取解决的方法是通过逐步回归法确定最终的有效影响因素,并进行必要的自相关性诊断预处理分析做出改进,最后得到相应的数学模型。
逐步回归的基本思路是先确定一个包含若干个自变量的初始集合,然后每次从几何外的变量中引入一个对因变量影响最大的,再对集合中的变量进行检验,从变得不显著的变量中移出一个影响最小的,依次进行,直到不能引入和移出为止,引入和移出都以给定的显著性水平为标准。 用数学方法分析和探索两种典型的网络营销方式(3):http://www.751com.cn/shuxue/lunwen_9161.html