基于JSP的Internet搜索引擎系统设计(2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于JSP的Internet搜索引擎系统设计(2)


1.2系统开发使用技术介绍
系统采用MyEclipse集成开发环境,JSP动态网页编程技术,Tomcat应用服务器和MYSQL后台数据库。
JSP是一种动态网页技术标准,在传统的网页HTML文件中加入Java程序片段和JSP标记就构成了JSP网页[2]。Web服务器在遇到访问JSP网页的请求时,首先执行其中的程序片段,然后将执行结果返回给客户,使系统开发变得迅速和容易。
Tomcat 是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器,在运行时Tomcat占有的系统资源小[3]。这使系统在运行中更加迅速,在开发中更加方便。
MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了双授权政策,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,极大地提高了系统开发的工作效率。
2.系统设计
2.1搜索引擎的结构
搜索引擎的结构分为四部分。
1.搜索器
搜索器主要按照某种策略在互联网中获取网页和抓取web信息的工作。
2.分析器
分析器功能是理解搜索器所搜索的信息,通过特定算法分析网页中的信息。同时,将获取网页中的超链接提取出来的信息交给索引器建立索引。
3.索引器
索引器主要用于对分析好的网页的抽象数据建立索引,为用户检索做准备。
4.检索器
检索器的主要功能是根据用户输入的关键词,在索引器建立的索引表中进行查询得到相关的信息,根据相关算法对这些数据进行排序,然后输出给用户。
2.2搜索引擎的实现原理
搜索引擎的实现原理分析为四步流程图1如下:
 
图1 搜索引擎实现原理
2.3数据库设计与实现
本系统中建立的数据库为spider,库中只有一个表song,如表1所示:
序号    字段名称    字段说明    类型    位数    属性    备注
1    id    序号    int    11    非空    主键
2    singer    歌手名    varchar    255    非空    
3    name    歌曲名    varchar    255    非空    
4    publicTime    出版时间    varchar    255    空    
5    companyName    出版公司    varchar    255    空    
6    specialName    专辑名称    varchar    255    空    
7    songurl    歌曲地址    varchar    255    空    
8    channelName    歌曲榜单    varchar    255    空    
9    lyricAuthor    歌词作者    varchar    255    空    
10    songAuthor    歌曲作者    varchar    255    空    
11    content    歌词    varchar    255    空     (责任编辑:qin)