菜单
  

                        string HTML0 = httpClient.GetString();
                        string HTML;
                        HTML=PatternMatch.NormalPatternMatch(HTML0,"<p class=\"result\" id=\"result\">(.|\n)+</p>");            
                         List<string> searchresullist = PatternMatch.MultiPatternMatch(HTML, "<p class=\"r-info|(\\sr-info\\d)\">(.|\n)*?</p>",true);
                        for (int ii = 0; ii < searchresullist.Count; ii++)
                        {
                            Sina sinaResult = new Sina();
                            sinaResult._RawString = searchresullist[ii];
                            urlList.Add(sinaResult);
                        }
                        for (int ii = 0; ii < urlList.Count; ii++)
                        {
                            urlList[ii].Analysis();
                        
                       for (int ii = urlList.Count-1; ii >= 0; ii--)
                        {
                            if (urlList[ii]._Abstract == null)
                            {
                                urlList.RemoveAt(ii);
                            }
                       }
                   
                }
    4.3 分词统计与分析模块详细设计
    4.3.1 分词系统概述
    分词系统主要是将一个语句切分成一个一个单独的词。分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。本文就是利用分词系统将新浪新闻的摘要内容进行分析。
    分析统计将新浪新闻摘要中分词后提取的所有关系动词出现的具体次数记录下来,并以这些关系动词的出现次数的次数用冒泡法做排序。
  1. 上一篇:ASP.net+sqlserver旅游信息网站设计+ER图
  2. 下一篇:ASP.net小型网上书店的设计与实现
  1. python+mysql网络习题爬取系统的设计与实现

  2. 神经网络算法在核素识别中的应用研究

  3. 苏州一建集团网络的规划与设计

  4. asp.net网络商城在线购物系统的设计与实现

  5. java局域网络的即时聊天系统设计+源代码

  6. 网络环境下电子报纸开发利用现状及模式研究

  7. 基于Agent的突发事件中网络...

  8. 十二层带中心支撑钢结构...

  9. 当代大学生慈善意识研究+文献综述

  10. 乳业同业并购式全产业链...

  11. 电站锅炉暖风器设计任务书

  12. 杂拟谷盗体内共生菌沃尔...

  13. 河岸冲刷和泥沙淤积的监测国内外研究现状

  14. 中考体育项目与体育教学合理结合的研究

  15. 酸性水汽提装置总汽提塔设计+CAD图纸

  16. java+mysql车辆管理系统的设计+源代码

  17. 大众媒体对公共政策制定的影响

  

About

751论文网手机版...

主页:http://www.751com.cn

关闭返回