菜单
string HTML0 = httpClient.GetString();
string HTML;
HTML=PatternMatch.NormalPatternMatch(HTML0,"<p class=\"result\" id=\"result\">(.|\n)+</p>");
List<string> searchresullist = PatternMatch.MultiPatternMatch(HTML, "<p class=\"r-info|(\\sr-info\\d)\">(.|\n)*?</p>",true);
for (int ii = 0; ii < searchresullist.Count; ii++)
{
Sina sinaResult = new Sina();
sinaResult._RawString = searchresullist[ii];
urlList.Add(sinaResult);
}
for (int ii = 0; ii < urlList.Count; ii++)
{
urlList[ii].Analysis();
for (int ii = urlList.Count-1; ii >= 0; ii--)
{
if (urlList[ii]._Abstract == null)
{
urlList.RemoveAt(ii);
}
}
}
4.3 分词统计与分析模块详细设计
4.3.1 分词系统概述
分词系统主要是将一个语句切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。本文就是利用分词系统将新浪新闻的摘要内容进行分析。
分析统计将新浪新闻摘要中分词后提取的所有关系动词出现的具体次数记录下来,并以这些关系动词的出现次数的次数用冒泡法做排序。
共15页:
上一页
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
下一页
上一篇:
ASP.net+sqlserver旅游信息网站设计+ER图
下一篇:
ASP.net小型网上书店的设计与实现
python+mysql网络习题爬取系统的设计与实现
神经网络算法在核素识别中的应用研究
苏州一建集团网络的规划与设计
asp.net网络商城在线购物系统的设计与实现
java局域网络的即时聊天系统设计+源代码
网络环境下电子报纸开发利用现状及模式研究
基于Agent的突发事件中网络...
十二层带中心支撑钢结构...
当代大学生慈善意识研究+文献综述
乳业同业并购式全产业链...
电站锅炉暖风器设计任务书
杂拟谷盗体内共生菌沃尔...
河岸冲刷和泥沙淤积的监测国内外研究现状
中考体育项目与体育教学合理结合的研究
酸性水汽提装置总汽提塔设计+CAD图纸
java+mysql车辆管理系统的设计+源代码
大众媒体对公共政策制定的影响
主页
计算机
机械
自动化
关闭菜单
栏目
毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
日语论文
英语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
菜单
毕业论文
刷新
分享
收藏
关于
关闭
关闭
分享本页
返回
关闭
暂无收藏
全部清除
关闭菜单
About
751论文网手机版...
主页:
http://www.751com.cn
关闭
返回