1 绪 论
我们处在一个信息资源高速膨胀的时代,信息爆炸已成为一个全球性的现象。然而,面对极度膨胀的信息量,面对“混沌信息空间”和“数据过剩”的巨大压力,人们对于信息的苦苦追求和期待忽然间变得踟蹰了。每天在我们所生活在的这个世界都会出现大量的信息,如果能够对这些信息做出一些筛选,既可以为我们的广大用户提供一些好的知识与信息,也为他们为了寻找这些知识与信息节省时间与成本.据统计,新产生的信息中有92%记录在硬盘等磁存储介质上,其次分别是胶片、纸张和光存储介质。也正因为如此各种搜索引擎也应运而生。66375
目 次
1.绪 论 1
1.1搜索引擎的意义 1
1.2桌面搜索引擎的意义 1
1.3桌面搜索引擎的现状 2
1.4 本文简介 3
2 Eclipse概述及开发环境搭建 3
2.1 ECLIPSE概述 3
2.2 ECLIPSE开发环境的搭建 4
3 Lucene的核心 7
3.1 全文检索引擎工具包LUCENE 7
3.2 全文检索 10
3.3 索引概述 16
3.4 索引过程 17
3.5 搜索与其流程 21
3.6 搜索与结果 22
4 Lucene桌面全文搜索引擎系统的分析与设计 24
4.1 桌面搜索引擎系统的功能介绍 24
4.2 LUCENE桌面搜索引擎系统使用的技术 24
4.3 LUCENE桌面搜索引擎系统分析 25
4.4 LUCENE桌面全文搜索引擎系统的设计 25
4.5 为本机的文件创建索引 26
4.6 搜索的效果 28
结论 29
致谢 30
参考资料 32
1.1 搜索引擎的意义
网络的出现把世界连接成了一个地球村,信息的传输再也不受到时间和空间的限制,但是处在这样一个信息爆炸的网络时代,仅仅是每天诞生的新知识,就可能让一个人一生也学不完。那么在这样一个“信息迷宫”里,如何才能把握自己需要的信息将会是最大的问题。虽然各个网站上的信息数不尽数,但是在没有搜索引擎的时代,用户希望寻找某方面的信息,就必须通过各种途径或者网站之间的超链接进行寻找。可以说,脱离了搜索引擎的网站都是一个一个的信息孤岛,用户必将面临巨大的搜寻成本,必须付出大量的时间和精力。
搜索引擎的出现改变了这一切,它通过程序的自动搜寻并建立索引,将这些信息孤岛联系起来,形成了一张网,并且运用分布式计算的巨大力量,能够让用户从海量数据中摒除垃圾信息,获取想要的知识。搜索引擎不仅仅是节省了用户的时间,通过挖掉搜寻成本这座墙,它让许许多多的不可能成为可能人们可以利用搜索引擎,获得更加全面、详尽的信息,参考性和点拨性都很强。因此,相当一部分职场人士表示,搜索引擎当之无愧是他们工作中非常完美的助手。如今,越来越多的白领已把获取信息的途径,从直接上门户网站、社区转向了搜索引擎工具。使用字典等工具书,上图书馆查阅资料的历史,逐渐从白领们的生活中淡出了。