Lucene桌面搜索引擎的设计与实现_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

Lucene桌面搜索引擎的设计与实现

摘要:信息时代的到来,极大的改变了人们的生活方式,随着计算机技术的发展,计算机硬盘逐渐更新换代,文件数目和种类越来越多,本地文件目录结构也越来越复杂。如何从海量文件中准确并且快速的找到自己所需要的信息变得越来越困难。桌面搜索引擎就是为了解决用户本地检索需求而出现的。
Lucene是一个开放源代码的全文检索引擎工具包,它提供了一个全文检索引擎的架构,它为桌面搜索引擎的设计与实现提供了便利。
本论文研究了搜索引擎的基本设计框架,剖析了Lucene内部调用接口以及相应原理,并基于Lucene设计与实现了一款简单绿色的桌面搜索引擎工具。具体分为如下几个模块:文件解析模块,中文分词模块,查询模块,用户界面模块。8994
关键词  桌面搜索引擎  文件解析  中文分词   Lucene
毕业设计说明书(论文)外文摘要
Title    Design and Implementation of Desktop Search Engine   
Abstract
The information age has greatly changed the way people live, with the development of computer technology, computer hard disk is the gradual replacement of an increasing number, file number and type of local file directory structure has become increasingly complex. How to file from the mass accurately and quickly find the information they need to become increasingly difficult. Desktop search engine is to solve the needs of the user's local search.
    Lucene is an open source full-text retrieval engine toolkit, which provides a full-text search engine framework for the Design and implementation of the desktop search engine, it provides a convenient.
This paper studies the basic design framework for the search engine, the call internal interface and the corresponding principle of the analysis of Lucene, based on Lucene designed with a simple green desktop search engine tool. It can be pided into the following modules: file parsing module, Chinese word segmentation module, query module, the user interface module. The following will detail the design process.
Keywords  Desktop Search Engine ; file parsing module ; segmentation module; Lucene
 目   次
1  引言 1
1.1  桌面搜索引擎简介… 1
1.2  主流桌面搜索引擎… 1
1.3  Lucene简介 3
系统设计 5
2.1  总体框架设计… 5
2.2  业务流程分析… 6
2.3  模块结构图 6
3  子模块分析设计… 7
3.1  文件解析模块… 7
3.2  分词索引模块 11
3.3  查询模块 15
3.4  用户界面模块 20
4  功能实现及效果 22
4.1  实现功能简介 22
4.2  各功能效果展示… 22
5  系统说明… 29
5.1  开发环境 29
5.2  用户须知 29
5.3  整体系统评价 32
结论  34
致谢  35
参考文献… 36
 1  引言
自计算机出现至今,它的快速发展,已经严重影响到人们的生活。现如今,人们越来越依赖计算机,计算机已经成为人们日常生活中必不可少的工具之一。起初,计算机的硬盘容量很小,可以储存的信息的总量相对较少,用户可以快速的搜索到自己想要的信息。随着时间的推移,计算机逐步发展,信息时代的来临使得计算机硬盘不断升级,大量的信息被存储到硬盘上。文件数目的不断增多和文件种类的多样以及本地目录结构的日益复杂化,使得人们从计算机中快速检索信息变得越来越困难。而现如今操作系统中自带的检索工具查询速度很慢,极大的浪费了人们的时间,如何能够快速的在计算机硬盘中检索文件已经成为一个不可忽视的问题。到目前为止,各大公司竞相推出自己的桌面搜索引擎,但却收效甚微。大部分桌面搜索工具资源占用率高,用户体验不好,操作困难,查询命中率低下。为此本文提供了一款简易快捷的桌面搜索引擎,它支持多种不同的检索方式,多种不同的应用选择,给用户极大的选择空间,可定位并且打开所需要的文件系统。 (责任编辑:qin)