1.2系统开发使用技术介绍
系统采用MyEclipse集成开发环境,JSP动态网页编程技术,Tomcat应用服务器和MYSQL后台数据库。
JSP是一种动态网页技术标准,在传统的网页HTML文件中加入Java程序片段和JSP标记就构成了JSP网页[2]。Web服务器在遇到访问JSP网页的请求时,首先执行其中的程序片段,然后将执行结果返回给客户,使系统开发变得迅速和容易。
Tomcat 是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器,在运行时Tomcat占有的系统资源小[3]。这使系统在运行中更加迅速,在开发中更加方便。
MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了双授权政策,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,极大地提高了系统开发的工作效率。
2.系统设计
2.1搜索引擎的结构
搜索引擎的结构分为四部分。
1.搜索器
搜索器主要按照某种策略在互联网中获取网页和抓取web信息的工作。
2.分析器
分析器功能是理解搜索器所搜索的信息,通过特定算法分析网页中的信息。同时,将获取网页中的超链接提取出来的信息交给索引器建立索引。
3.索引器
索引器主要用于对分析好的网页的抽象数据建立索引,为用户检索做准备。
4.检索器
检索器的主要功能是根据用户输入的关键词,在索引器建立的索引表中进行查询得到相关的信息,根据相关算法对这些数据进行排序,然后输出给用户。
2.2搜索引擎的实现原理
搜索引擎的实现原理分析为四步流程图1如下:
图1 搜索引擎实现原理
2.3数据库设计与实现
本系统中建立的数据库为spider,库中只有一个表song,如表1所示:
序号 字段名称 字段说明 类型 位数 属性 备注
1 id 序号 int 11 非空 主键
2 singer 歌手名 varchar 255 非空
3 name 歌曲名 varchar 255 非空
4 publicTime 出版时间 varchar 255 空
5 companyName 出版公司 varchar 255 空
6 specialName 专辑名称 varchar 255 空
7 songurl 歌曲地址 varchar 255 空
8 channelName 歌曲榜单 varchar 255 空
9 lyricAuthor 歌词作者 varchar 255 空
10 songAuthor 歌曲作者 varchar 255 空
11 content 歌词 varchar 255 空 基于JSP的Internet搜索引擎系统设计(2):http://www.youerw.com/jisuanji/lunwen_4753.html