Lucene桌面全文搜索引擎系统的分析与设计_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

Lucene桌面全文搜索引擎系统的分析与设计

1  绪 论

我们处在一个信息资源高速膨胀的时代,信息爆炸已成为一个全球性的现象。然而,面对极度膨胀的信息量,面对“混沌信息空间”和“数据过剩”的巨大压力,人们对于信息的苦苦追求和期待忽然间变得踟蹰了。每天在我们所生活在的这个世界都会出现大量的信息,如果能够对这些信息做出一些筛选,既可以为我们的广大用户提供一些好的知识与信息,也为他们为了寻找这些知识与信息节省时间与成本.据统计,新产生的信息中有92%记录在硬盘等磁存储介质上,其次分别是胶片、纸张和光存储介质。也正因为如此各种搜索引擎也应运而生。66375

目  次

1.绪 论 1

1.1搜索引擎的意义 1

1.2桌面搜索引擎的意义 1

1.3桌面搜索引擎的现状 2

1.4  本文简介 3

2  Eclipse概述及开发环境搭建 3

2.1  ECLIPSE概述 3

2.2  ECLIPSE开发环境的搭建 4

3  Lucene的核心 7

3.1  全文检索引擎工具包LUCENE 7

3.2  全文检索 10

3.3  索引概述 16

3.4  索引过程 17

3.5  搜索与其流程 21

3.6  搜索与结果 22

4  Lucene桌面全文搜索引擎系统的分析与设计 24

4.1  桌面搜索引擎系统的功能介绍 24

4.2  LUCENE桌面搜索引擎系统使用的技术 24

4.3  LUCENE桌面搜索引擎系统分析 25

4.4  LUCENE桌面全文搜索引擎系统的设计 25

4.5  为本机的文件创建索引 26

4.6  搜索的效果 28

结论 29

致谢 30

参考资料 32

1.1  搜索引擎的意义

网络的出现把世界连接成了一个地球村,信息的传输再也不受到时间和空间的限制,但是处在这样一个信息爆炸的网络时代,仅仅是每天诞生的新知识,就可能让一个人一生也学不完。那么在这样一个“信息迷宫”里,如何才能把握自己需要的信息将会是最大的问题。虽然各个网站上的信息数不尽数,但是在没有搜索引擎的时代,用户希望寻找某方面的信息,就必须通过各种途径或者网站之间的超链接进行寻找。可以说,脱离了搜索引擎的网站都是一个一个的信息孤岛,用户必将面临巨大的搜寻成本,必须付出大量的时间和精力。

搜索引擎的出现改变了这一切,它通过程序的自动搜寻并建立索引,将这些信息孤岛联系起来,形成了一张网,并且运用分布式计算的巨大力量,能够让用户从海量数据中摒除垃圾信息,获取想要的知识。搜索引擎不仅仅是节省了用户的时间,通过挖掉搜寻成本这座墙,它让许许多多的不可能成为可能人们可以利用搜索引擎,获得更加全面、详尽的信息,参考性和点拨性都很强。因此,相当一部分职场人士表示,搜索引擎当之无愧是他们工作中非常完美的助手。如今,越来越多的白领已把获取信息的途径,从直接上门户网站、社区转向了搜索引擎工具。使用字典等工具书,上图书馆查阅资料的历史,逐渐从白领们的生活中淡出了。 (责任编辑:qin)