3.5.1 引擎与独立搜索引擎比较 13
3.5.2 元搜索引擎的局限性和发展趋势 14
4 元搜索结果消重算法 17
4.1 网页消重技术 17
4.1.1 现有主流网页消重技术 18
4.1.2 现有网页消重技术的局限 18
4.2 一个元搜索网页消重方法 18
5 算法实现及结果分析 21
5.1 实验环境简介 21
5.2 流程图 21
5.3 程序图片消重方法 21
5.4 程序实现 26
结论 28
致谢 29
参考文献 30
1 绪论
由于计算机网络及相关技术的日渐成熟,加上数字摄像设备的普及,在网页上使用图像变得非常普遍。图像既能够极大的丰富网页的可观性和趣性,又能够增强用户对网页信息的直观认识,已经成为了当今网页中不可或缺的一部分。网页图像成为了用户获取自己感兴趣图像的一个重要来源。如何根据用户的需求进行有效而快速的搜集图像信息成为当今研究的热点,也对我们提出了新的挑战。
1.1 图像搜索的研究背景及意义
随着网络技术的飞速发展,多媒体应用的兴起,图像的应用也越来越广,使得整个互联网世界奕奕生辉。同时计算机大容量、高速存储技术的发展,也为图像提供了大量和快捷的存储方式。但是随之而来的图像信息自身的无序化问题也越来越突出。由于Internet 本身结构上、管理上的问题,想要在Internet 准确、快速、全面地找到自己所想要的图像,并不是一件容易的事情。
据统计,人类接受的外部信息,70%以上来自视觉,图像作为一种内容丰富,表现直观的多媒体信息被大量广泛地使用,如何有效管理、检索图像信息成为迫切需要解决的问题。传统的基于文本和内容的检索无法满足海量环境下多媒体信息库的检索要求。为了克服基于文本和内容方法的局限性,出现了基于元搜索引擎的图像检索。
由于Internet上的信息内容没有结构;网上信息量庞大且还在不断的增加。因此,网络产生了搜索引擎。虽然这些给网络用户提供了不少的帮助,但是由于偏离准确、快速、全面地检索自己所要的图像,所以对图像检索还要作很大的研究。
根据国内外现有的检索引擎以及有关研究小组种种资料表明,现有的网络资源和搜索引擎具有如下特点:
(1)索引的数据种类丰富,如文字、图像、声音等多媒体。数据的存取协议也是多种多样的,如HTTP、FTP、News、Gopher等;
(2)索引数据量大,导致不可能有某个数据库能包括整个Internet的索引,目前最大的检索引擎,其中的索引也只不过覆盖了Internet的一小部分;
(3)资源消耗太大,系统需要将HTML文件传送至本地然后分析,大量占用昂贵的网络带宽和CPU资源,增加被检索结点的负担。另外由于现有的检索引擎一般是集中式的,所以检索引擎服务器本身的硬件配置也极高,才能处理庞大的数据量和及时地响应用户的查询请求;
(4)不能有效解决索引失效问题,很多时候,检索引擎会返回无效的查询结果;
(5)各检索工具各行其事,不能相互协作,在一定意义上讲是一种资源的浪费。
二十一世纪是一个多元化的信息社会,对图像的需求将是前所未有的巨大,图像数据库也将得到长足的发展。因此,图像检索系统具有广阔的应用前景。
1.2 本文研究的内容
图片信息检索作为当今研究的热点,针对元搜索图片搜索引擎的研究很多,本文主要研究的内容如下: 基于源搜索引擎的图片搜索研究(2):http://www.youerw.com/jisuanji/lunwen_7517.html