网络爬虫的设计与实现+文献综述(4)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

网络爬虫的设计与实现+文献综述(4)


第优尔部分——全文总结。对全文的工作进行总结,并对后续的研究提出一些展望。
2    系统开发工具和平台及相关技术介绍
本章内容介绍了本系统所采用的开发工具及所用平台。本系统采用了JAVA语言、MyEclipse8.5以及tomcat6.0。
2.1    程序开发工具
2.1.1    JDK
JDK(Java Development Kit)是Sun Microsystems针对Java开发员的产品。自从Java推出以来,JDK已经成为使用最广泛的Java SDK。JDK 是整个Java的核心,包括了Java运行环境、Java工具和Java基础类库。JDK是学好Java的第一步。而专门运行在x86平台的Jrocket在服务端运行效率也要比Sun JDK好很多。从SUN的JDK5.0开始,提供了泛型等非常实用的功能,其版本也不断更新,运行效率得到了非常大的提高。
JDK包含的基本组件包括:
javac – 编译器,将源程序转成字节码;
jar – 打包工具,将相关的类文件打包成一个文件;
javadoc – 文档生成器,从源码注释中提取文档;
jdb – debugger,查错工具;
java – 运行编译后的java程序(.class后缀的);
appletviewer:小程序浏览器,一种执行HTML文件上的Java小程序的Java浏览器;
Javah:产生可以调用Java过程的C过程,或建立能被Java程序调用的C过程的头文件;
Javap:Java反汇编器,显示编译类文件中的可访问功能和数据,同时显示字节代码含义;
Jconsole: Java进行系统调试和监控的工具。
2.1.2    MYECLIPSE
MyEclipse是一个十分优秀的,用于开发Java J2EE的Eclipse插件集合。MyEclipse的功能非常强大,支持也十分广泛,尤其是对各种开源产品的支持非常好。
MyEclipse企业级工作平台(MyEclipse Enterprise Workbench,简称MyEclipse)是对Eclipse IDE的扩展。利用它可以在数据库和JavaEE的开发、发布,以及应用程序服务器的整合方面极大地提高工作效率。它是功能丰富的JavaEE集成开发环境,包括了完备的编码、调试、测试和发布功能,完整支持HTML、Struts、JSF、CSS、JavaScript、SQL和Hibernate。
在结构上,MyEclipse的特征可以被分为7类:
1)JavaEE模型
2)Web开发工具
3)EJB开发工具
4)应用程序服务器的连接器
5)JavaEE项目部署服务
6)数据库服务
7)MyEclipse整合帮助
对于以上每一类特征,在Eclipse中都有相应的功能部件,并通过一系列的插件来实现它们。MyEclipse结构上的这种模块化,可以让我们在不影响其他模块的情况下,对任一模块进行单独的扩展和升级。
2.1.3    TOMCAT
Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。由于有了Sun 的参与和支持,最新的Servlet总是能在Tomcat 中得到体现,Tomcat 6 支持最新的Servlet 3.0。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。目前最新版本是7.04。
Tomcat 是一个轻量级应用服务器,在中小型系统和并发访问用户不是很多的场合下被普遍使用,是开发和调试中小型Web应用 程序的首选。对于一个初学者来说,可以这样认为,当在一台机器上配置好Apache 服务器,可利用它响应对HTML 页面的访问请求。实际上Tomcat 部分是Apache 服务器的扩展,但它是独立运行的,所以当你运行tomcat时,它实际上作为一个与Apache独立的进程单独运行的。
2.1.4    SERVLET原理及特点
Servlet是指运行在服务器端的Java小程序,用于响应客户端的请求。在默认情况下,Servlet采用一种无状态的请求-响应处理方式。Servlet代码的主要作用是为了增强Java服务器端的功能,它运行在服务器端,用于接收并且处理浏览器客户端发出的请求,该请求是通过配置文件web.xml的相关配置进行转发。也就是说Servlet是一个标准的Java类,它符合Java类的一般规则。和一般的Java类不同之处只是在于Servlet可以处理Http请求。以下就是Servlet主要特点: (责任编辑:qin)