2技术背景
本次课题的开发主要用到了ASP.NET、HTML、中文分词系统和文本相似度算法。
2.1 ASP.NET概述
ASP.NET是一种服务器端技术可以用来创建和运行web应用程序或动态网页。可以创建web应用程序,使用HTML网页作为用户界面,也可以在网页中添加交互式内容,它有以下诸多优点。ASP.NET的主要优点大概可以归纳如下:
(1)ASP.NET是运行在服务器上的用于所有语言的程序。和之前的ASP解释程序不同,这是程序第一次在服务器端时运行时进行编译,执行效果明显强于一条条的解释。
(2)ASP.NET构架是可以用微软公司最新的产品 Visual Studio.net开发环境进行开发,WYSIWYG(What You See Is What You Get所见即为所得)的编辑。这些只是ASP.NET强大化软件支持的一小部分。
(3)ASP.NET是在通用语言的基础上编译的,有很强的可移植性,可以运行在很多开发平台上。在ASP.NET中可以选择一种合适或多种语言来编写程序,因为它的语言是独立的。ASP.NET一般分为两种开发语言,VB.NET和C#,而C#是用的比较频繁,它是.NET特有的语言,如果没有其他开发语言经验的读者可以先学习C#。
(4)ASP.NET对浏览器的要求不高,只要使用的浏览器可以执行HTML代码,就能查看网页内容。因为它在服务器端运行的,服务器会在程序运行完成后,把结果反馈给浏览器,这样能极大的提高交互速度。
(5)在浏览器上只能看到由服务器传出的动态HTML文件,除开发者以外的人不会看到源程序代码,因为程序的代码被隐藏了。这样可以避免所写的源程序被别人抄袭,从而提高了程序的安全性。
(6)面向对象(Object oriented),并可扩展ActiveX Server组件功能。
(7)ActiveX服务器组件有无限的可延伸性。可以使用任何编程语言来编写所需要的ActiveX Server 组件。
(8)ADO是一种新的数据访问模型,Web网页开发人员可以利用此数据库便捷的存取,并且可以在客户端上即时更新显示。访问数据库很便捷,所以存取数据库也很方便。
2.2 HTML
HTML语言是网络通用的语言,它可以把文本和图形信息整合起来在网站上显示。人们可以通过鼠标的点击来获取相应的内容,它是一种通用简单的全置标记语言,HTML可以用文本和图片组成复杂的网页,人们可以随时的上网浏览, 这种语言写的页面无论使用的是什么类型的电脑或浏览器都可以进行浏览。十分的方便和通用。而且HTML可以很多的其他语言进行整合,相互配合如JSP,PHP,JAVA等。这样使得对于WEB的开发更加的便利。也让HTML站有不可动摇的地位。
Html不需要特别的软件来进行编程,你可以就使用系统自带的记事本或者文本编辑软件就可以进行编程。HTML是非常的简单的,你只要掌握基本的知识,就可以来制作你要的web网站,是不是十分的容易。它就像指挥乐队一样,哪边停顿,哪里起伏,只需要你轻轻的做一点改动。
HTML是一种非常强大的超文本标记语言,它的功能非常的强大,而且支持不同格式的数据文件的镶入。它有很明显的特点,一是简易性采用超集方式的版本升级,使得它使用起来非常的方便灵活。其二是它的可扩展性,广泛的应用带来了功能的加强,同时也增加了标识符的要求,超文本标记语言采用子类元素的方式也系统的扩展带来了保证。三是平台无关性,可以在各个平台上执行和运行。这也是它为什么可以在万维网这么流行的原因。
一般HTML页面是以DOCTYPE标签开始的,这是用来声明文档类型的,不能有任何内容(包括换行符和空格)在它的前面,如果有的话会导致此文档无效,紧接着是以<html>标签开始,以</html>结束。在它们之间,夹着<head>和<body>标签 整个页面有两部分--标题和正文。<head>是标题词在网站的最小页面显示的标题,<body> 是整个网页的主体部分,所有的图片和文本,以及排版都是在< body></body>中完成的。