现定义一个n阶方阵序列:
D(-1),D(0),D(1),…,D(k),…,D(n-1)
其中D(-1)[i][j]=G.arcs[i][j]
D(k)[i][j]=Min{D(k-1)[i][j],D(k-1)[i][k]+ D(k-1)[k][j]} 0<=k<=n-1 从上述计算公式可见,D(1)[i][j]是从vi到vj的中间顶点序号不大于1的最短路径的长度;D(k)[i][j]是从vi到vj的中间顶点序号不大于k的最短路径的长度,D(n-1)[i][j]就是从vi到vj的最短路径长度。
2.2 开发环境和工具
2.2.1 Visual Studio 2008
Microsoft Visual Studio 2008是面向Windows Vista、Office 2007、Web的下一代开发工具。VS2008引入 了250多个新特性,整合了对象、关系型数据、XML的访问方式,语言更加简洁。使用Visual Studio 2008可以高效开发Windows应用程序。设计器中可以实时反映变更,XAML中智能感知功能可以提高开发效率。同时Visual Studio 2008支持项目模板、调试器和部署程序。Visual Studio 2008可以高效开发Web应用,集成了AJAX 1.0,包含AJAX项目模板,它还可以高效开发Office应用和Mobile应用。
2.2.2 Microsoft Access
Microsoft Office Access是由微软发布的关联式数据库管理系统。它结合了 Microsoft Jet Database Engine 和图形用户界面两项特点,是 Microsoft Office 的系统程式之一。Access能够存取 Access/Jet、Microsoft SQL Server、Oracle,或者任何 ODBC兼容数据库内的资料。在这次课题中,数据库只用于存放初始数据,因此,选择了简单且容易使用并且占用系统资源少的的Access。
3 课题的研究方法和实现
3.1 课题研究方法
751度分割肯定了人与人之间的普遍联系,但是没有对这种联系作定量分析。我们一生可能会认识千百人,他们有的对我极其重要,有的对我无足轻重,我们联系建立的原因和方法也是千差万别的。有父母亲属这类生而固有的联系,也有因为地理位置接近发展出来的。如邻里关系,还有因为共同学习生活而发展出来的同学、同事关系。751度分割理论中只把他们统统归结于联系,却没有强弱之分。在网状结构里面,人与人的关系,需要加权处理,在这里,751度分割理论还是残缺的。本文基于这个观点提出了基于紧密度的模型,同时以基于跳数的模型作为对比,在一定程度上体现了这种关系的强弱。本文以计算机学术圈以及华人影视圈作为研究对象对这其小世界特性做初步探讨。
计算机学术圈,我们采用的数据是近5年来在计算机学报以及软件学报上刊登的所有文章信息,娱乐圈方面搜集的则是近5年来上映的电影信息。两者采用的是相同的研究方法。以计算机学术圈为例,在计算机中,我们将每个学者视为一个节点,并为每个有直接联系的双方添加一条边。权值的多少依赖于所研究的不同的模型。本课题中采用了基于跳数和基于紧密度两种模型。基于跳数的模型建立的最短路径是指经过最少跳数的路径,其每天边的权值均置1,基于紧密度的模型的权值则是根据两位学者联名发表论文的次数,取其倒数作为边的权值,这样合作越多的两人之间的边的权值越小,即紧密度越高。
我们只需遍历数据,将建立所有作者的简单信息表,并为其编号,在内存中以图的形式构建学者关系网络。然后通过图论的一些基本研究方法,诸如floyd,dijkstra等算法,分别计算出两种模型的一些特征参数,如最大路径长度,最小路径长度,平均路径长度,聚合度,稠密度等等。以此来验证及研究它的小世界特性。同理,影视娱乐圈也是如此。在挖掘数据的同时,还将实现具体地构建联系双方最短路径的功能,以及构建人物关系网等一些直观的功能。
本次课题重在研究两个圈子的一些小世界特性,并没有更多地扩展实际的人物关系,因此只有人物节点只有name和Id两个属性,但是在数据库和程序中都留了可供拓展的设计,日后完全有可能加以完善,设计成一个具有挖掘对个人有用信息的一个软件。 中国学术界和华人影视界X度空间理论初探(5):http://www.751com.cn/jisuanji/lunwen_9455.html