4.1 概述 16
4.2 系统功能设计 18
4.3 数据库设计 20
4.4 本章小结 23
5 系统详细设计及编码 24
5.1 系统主界面的设计 24
5.2 功能模块介绍 25
5.3 本章小结 28
6总结 29
致谢 30
参考文献 31
1 绪论
1.1 研究目的和意义
近年来,随着互联网规模和用户数量的不断增长,互联网应用飞速发展,我国信息化水平迅速提高。人们越来越依赖互联网进行交流、讨论以及购物休闲,乃至从事学术研究、商户贸易等重要领域。由于互联网的快速传播能力及其开放性,它已成为人们获取信息和发布信息的重要渠道。
其中,网络新闻是互联网上的一大应用。它以互联网为依托,利用其优势推动新闻报道的发展,从而开启了一个新的传媒时代。网络新闻通过它及时、快速、多元化和交互性强的特点,迅速的成为了广大网民获取信息的来源之一。
网络新闻的出现,致使新闻信息数量大大增加;同时由于网络新闻的门槛较低,使得网络新闻的种类繁多、垃圾信息泛滥、信息质量参差不齐,影响人们获取信息的速度。基于这些问题的存在,网络新闻采集显得十分重要,这样方可以新闻工作者在众多的新闻中找到自己需要的新闻和信息。在通过基本的需求了解后,我们得到此次新闻采集系统的研究意义:
第一,推动传统新闻采访变革。互联网为人类开辟了一个崭新的信息时代,其被冠以“第四媒介”的称号。每次新媒介的出现都会促使旧媒介的发展,互联网的出现也不例外。
第二,加强新闻工作者们对网络新闻采集的掌握。当今新旧媒体的竞争日益激烈,是否通晓网络新闻采集技术是能否赢得竞争的关键因素。目前,我国新闻从业人员利用互联网进行新闻采集的整体水平还相对较低,这就为该项研究提出现实必要性。
1.2 新闻采集的研究现状
现在在国内外都出现了一些网络新闻采集程序,包括谷歌、新浪和百度都出品了自己的新闻采集系统,还有网络上出现比较多的天钩、雷达、小蜜蜂,Robot等都是这方面的采集器。这些采集器很大程度上解决了网络上新闻种类繁多、垃圾信息泛滥、信息质量参差不齐的问题。如下图1.1和1.2所示,这是网络上使用比较频繁新闻采集器的示例。
图1.1 火车新闻采集器
图1.2 云里新闻采集器
这些新闻采集器大多数需要用户了解一定的采集规则,才能快速精确的找到相关的资料。从现在来说,要获得用户需要获得的相关新闻信息并结构化保存到相应数据库中,用户是必须对采集正则有一定熟悉和了解的。将来,在信息网络迅速发展的今天,为了使用户能够简单快捷的使用相应的功能,取缔采集正则是十分必要的事。
1.3 论文组织
第一章介绍了项目的研究目的和意义以及项目的研究背景。
第二章介绍了网络新闻采集的定义以及新闻采集系统的工作原理,包括工作流程等。