毕业论文
计算机论文
经济论文
生物论文
数学论文
物理论文
机械论文
新闻传播论文
音乐舞蹈论文
法学论文
文学论文
材料科学
英语论文
日语论文
化学论文
自动化
管理论文
艺术论文
会计论文
土木工程
电子通信
食品科学
教学论文
医学论文
体育论文
论文下载
研究现状
任务书
开题报告
外文文献翻译
文献综述
范文
社会舆情信息采集研究(3)
2.1 正则表达式简介 正则表达式[7] 是一种可以用于模式匹配和替换的强有力的工具,一个正则表达式 就是由普通的字符(例如字符 a到z)以及特殊字符(称为元字符)组成的文字模式, 它描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板, 将某个字符模式与所搜索的字符串进行匹配。 正则表达式在字符数据处理中起着非常重要的作用,我们可以用正则表达式完 成大部分的数据分析处理工作,如: 判断一个串是否是数字、是否是有效的 Email 地 址,从海量的文字资料中提取有价值的数据等等,如果不使用正则表达式,那么实 现的程序可能会很长,并且容易出错。对这点本人深有体会,面对大量工具书
电子
档资料的整理工作,如果不懂得应用正则表达式来处理,那么将花费很大的时间, 反之则将可以轻松地完成,获得事半功倍的效果。
2.2 HTMLParser 概述 HTMLParser [8] 是一个开源的Java库,它提供接口,支持线性和嵌套的解析HTML 文本,HTMLParser Libraries 提供了一系列访问本地和网络 HTML 资源的 API。 Htmlparser.jar 提供底层的接口,它负责访问 HTML 中的文本、注释、标签等节点, 并把它们转换成线性的节点。HTMLParser 提供了两种访问节点的方法:Filter 模式 和Visitor 模式。
共3页:
上一页
1
2
3
下一页
上一篇:
电子商务网站分类使用中的学习现象研究
下一篇:
基于UML的某社团网站系统的建模与设计
银行行办公信息服务系统【1544字】
论信息技术茬外语教學中的應用【3270字】
计算机信息管理茬第三方...
电子商务中信息不對称问题研究【2365字】
用友NC信息系统的实施應用实践研究【3307字】
网络信息安全技术管理的...
商业银行管理信息系统开...
互联网教育”变革路径研究进展【7972字】
张洁小说《无字》中的女性意识
老年2型糖尿病患者运动疗...
网络语言“XX体”研究
我国风险投资的发展现状问题及对策分析
新課改下小學语文洧效阅...
LiMn1-xFexPO4正极材料合成及充放电性能研究
安康汉江网讯
ASP.net+sqlserver企业设备管理系统设计与开发
麦秸秆还田和沼液灌溉对...