基于JSP的Internet搜索引擎系统设计(2)
时间:2017-04-09 14:02 来源:毕业论文 作者:毕业论文 点击:次
1.2系统开发使用技术介绍 系统采用MyEclipse集成开发环境,JSP动态网页编程技术,Tomcat应用服务器和MYSQL后台数据库。 JSP是一种动态网页技术标准,在传统的网页HTML文件中加入Java程序片段和JSP标记就构成了JSP网页[2]。Web服务器在遇到访问JSP网页的请求时,首先执行其中的程序片段,然后将执行结果返回给客户,使系统开发变得迅速和容易。 Tomcat 是一个免费的开放源代码的Web 应用服务器,属于轻量级应用服务器,在运行时Tomcat占有的系统资源小[3]。这使系统在运行中更加迅速,在开发中更加方便。 MySQL是一种关联数据库管理系统,关联数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQL的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了双授权政策,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,极大地提高了系统开发的工作效率。 2.系统设计 2.1搜索引擎的结构 搜索引擎的结构分为四部分。 1.搜索器 搜索器主要按照某种策略在互联网中获取网页和抓取web信息的工作。 2.分析器 分析器功能是理解搜索器所搜索的信息,通过特定算法分析网页中的信息。同时,将获取网页中的超链接提取出来的信息交给索引器建立索引。 3.索引器 索引器主要用于对分析好的网页的抽象数据建立索引,为用户检索做准备。 4.检索器 检索器的主要功能是根据用户输入的关键词,在索引器建立的索引表中进行查询得到相关的信息,根据相关算法对这些数据进行排序,然后输出给用户。 2.2搜索引擎的实现原理 搜索引擎的实现原理分析为四步流程图1如下: 图1 搜索引擎实现原理 2.3数据库设计与实现 本系统中建立的数据库为spider,库中只有一个表song,如表1所示: 序号 字段名称 字段说明 类型 位数 属性 备注 1 id 序号 int 11 非空 主键 2 singer 歌手名 varchar 255 非空 3 name 歌曲名 varchar 255 非空 4 publicTime 出版时间 varchar 255 空 5 companyName 出版公司 varchar 255 空 6 specialName 专辑名称 varchar 255 空 7 songurl 歌曲地址 varchar 255 空 8 channelName 歌曲榜单 varchar 255 空 9 lyricAuthor 歌词作者 varchar 255 空 10 songAuthor 歌曲作者 varchar 255 空 11 content 歌词 varchar 255 空 (责任编辑:qin) |