基于源搜索引擎的图片搜索研究(4)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于源搜索引擎的图片搜索研究(4)


  Javascript 是一种宽松类型的语言。宽松类型意着我们不必显式定义变量的数据类型。我们无法在JScript上明确地定义数据类型。此外,在大多数情况下,Javascript 将根据需要自动进行转换。比如将一个数值添加到由文本组成的某项,该数值将被转换为文本。
2.3  JS的发展史以及安装
    JavaScript语言的前身叫作Livescript。在Sun公司推出著名的Java语言之后,Netscape公司引进了Java的程序的相关概念,在此基础上将自己原有的Livescript 重新进行设计,并命名为JavaScript。
JavaScript是一种基于客户端浏览器的语言,用户在浏览中填表、验证的交互过程只是通过浏览器对调入HTML文档中的JavaScript源代码进行解释执行来完成的,即使是必须调用CGI的部分,浏览器也只是将用户输入验证后的信息提交给远程的服务器,这样大大减少了服务器的开销。现如今,JS是赋予网页活力与交互性的主要手段之一,全世界都有无数的网页在依靠javaScript完成各种关键任务,随着WEB2.0和Ajax进入主流,javaScript已经被推到了舞台中心,在开发更大更复杂的程序中使用它势在必行,更多开发人员和web设计师将会需要熟练掌握JS。
3  图像搜索
    图像搜索是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。通过输入与图片名称或内容相似的关键字或通过上传与搜索结果相似的图片或图片URL进行搜索。
3.1  图像搜索的工作原理
最基本的检索引擎的结构,是由Spider不停地从Web网上收集数据,存放在检索引擎的数据库中。用户通过检索引擎服务器上的Web接口,提出检索请求,Web Server通过CGI或其它技术访问数据库,并将用户的检索请求转换成相应的数据存取语句,送给数据库引擎处理,并把查询结果通过网页显示给用户。
网络检索的基本原理是通过网络机器人定期在web网页上爬行,然后发现新的网页,把它们取回来放到本地的数据库中,用户的查询请求可以通过查询本地的数据库来得到。
一般来说网络信息检索的实现机制一般有两种:一是通过手工方式对网页进行索引,它的缺点是Web的覆盖率比较低,同时不能保证最新的信息。查询匹配是通过用户写入的关键字和网页的描述和标题来进行匹配,而不是通过全文的匹配进行的;二是对网页进行自动的索引,这种能实现自动的文档分类,实际上采用了信息提取的技术。但是在分类准确性上可能不如手工分类。
在现在所有运行的检索工具来说,一般都有一个Robot定期的访问一些站点,来检查这些站点的变化,同时查找新的站点。一般站点有一个robot.txt文件用来说明服务器不希望Robot访问的区域,Robot 都必须遵守这个规定。如果是自动索引的话,Robot在得到页面以后,需要对该页面根据其内容进行索引,根据它的关键字的情况把它归到某一类中。页面的信息是通过元数据的形式保存的,典型的元数据包括标题、IP地址、一个该页面的简要的介绍,关键字或者是索引短语、文件的大小和最后的更新的日期。尽管元数据有一定的标准,但是很多站点都采用自己的模板。文档提取机制和索引策略对Web检索引擎的有效性有很大的关系。高级的检索选项一般包括:布尔方法或者是短语匹配和自然语言处理。一个查询所产生的结果按照提取机制被分成不同的等级提交给用户。最相关的放在最前面。每一个提取出来的文档的元数据被显示给用户。同时包括该文档所在的URL地址。
另外有一些关于某一个主题的专门的引擎,它们只对某一个主题的内容进行检索和处理,这样信息的取全率和精度相对就比较高。 (责任编辑:qin)