案例推理系统得以应用的前提是相似度的计算,相似度也可称之为距离,相似度算法系统结构的理论框架是由Osborne and Bridge (1996, 1997) 和Bridge (1998)提出。其他的研究工作在案例推理系统的实际应用上也提出了新的方法,如Liao和Zhang(1998)完成了一篇关于相似性算法的使用评论,这些研究结果显示,不同相似性算法的性能与代表案例的属性类型和这些属性的重要程度有很大的关系。为了获得更广发的研究和结果, Wilson和Martinez(1997)提出了两个距离计算,基于异构数据集上的距离度量函数,结果显示出了这两种计算方法的高效性。23402
国外关于相似度计算的研究领先于国内,国内在相似度方面的领军人物有中科院的许禄、云南师范大学的高炜、沈阳航空工业大学的蔡东风、国防科学技术大学的邓苏和安徽大学的郑诚。对相似度进行研究的专家学者大多来自计算机领域,近年来,也有不少情报学领域专家学者对相似度进行研究。其中,大多集中在语义相似度计算。基于本体的方法,也是近年来的研究热点。论文网
在基于案例相似度计算,杨健等[26]对K-NN算法(基于案例检索系统的案例相似度计算方法)作了改进,提出了基于时序的多阶特征权重改进算法。邹鹏等[27]在构建案例库时运用GA算法,进行案例相似度计算,基于相似度计算结果,判断案例是否可以加入案例库。秦玉平等[28]基于传统案例检索方法的不足,提出了一种按长度/面积重合率计算区间属性相似度法。汪晓睿等[29]提出了关键字相似度计算法,并将其应用在案例检索系统上,提高了检索结果的精确度。于本海等[30]提出一种基于神经网络的相似度计算模型,可自动计算特征属性的权重,避免了人工赋值的主观性。
2014年4月,在中国知网上,以“相似度”为题名进行检索,共搜索得到文献1993篇,结合了统计分析软件NoteExpress,通过关键词统计,得出表1.2的数据。
表1. 2 CNKI中关于“相似度”的关键词统计
关键词 篇数 关键词 篇数 关键词 篇数
相似度 376 图像质量评价 30 Web服务 18
语义相似度 178 语义 28 形式概念分析 18
本体 177 聚类 28 中药 18
知网 72 中文处理系统 27 特征提取 17
概念相似度 65 人眼视觉系统 27 文本分类 17
相似度计算 58 领域本体 25 WordNet 17
句子相似度 50 概念 25 Vague集 17
语义距离 50 聚类分析 23 问答系统 17
结构相似度 50 遗传算法 23 分词 16
本体映射 50 协同过滤 22 信息量 16
向量空间模型 47 伪距离 22 图像融合 16
文本相似度 44 义原 21 链接分析 16 案例推理系统相似度研究现状:http://www.youerw.com/yanjiu/lunwen_16435.html