面向中医诊断帕金森病领域多标签学习(5)
时间:2022-07-23 10:32 来源:毕业论文 作者:毕业论文 点击:次
文章主要分为四部分:第一部分主要讨论了中医及其诊断帕金森病的现状和多标签分类用于中医领域的可行性分析;第二部分详细介绍了当前多标签学习相关的研究近况;第三部分探索和比较不同多标签算法在帕金森数据集上的执行效果;第四部分制作以多标签分类算法为核心的中医诊断帕金森病的预测系统。 文章的结构如下: 第一章阐述帕金森病的背景、中医及其诊断帕金森的现状、计算机学科与中医学的交叉和多标签分类技术用于帕金森病诊断的可行性。 第二章展示多标签学习的研究现状、典型算法、评价指标和部分应用。论文网 第三章评价各典型算法用于帕金森病数据集后的不同结果,探讨分类算法在帕金森数据集上的预测效果和特点。 第四章展示以多标签分类算法为核心的中医诊断帕金森病辅助系统。 最后总结已有工作,展望未来多标签分类的可研究前景。 2 多标签学习的研究现状 2。1 引言 目前人工智能的研究核心之一——监督学习是机器学习中探究最多、使用最普及的一种学习框架,而分类又是机器学习在监督学习领域中主要的任务之一。 给定训练集中的每个实例含有明确定义的特征集合(向量)和对应的标签集合(向量),分类的目标是通过训练集得到一个能够为未知实例预测合适标签的预测模型。 传统的单标签分类学习(Single-label Learning)指的是一个实例只可能属于一种类别,显然这个条件限制了分类算法在现实中的应用。多标签分类学习(Multi-label Learning,简称MLL)指的是一个实例可以同时属于多个类别。 对象的多义性在现实中无处不在,只具有独一无二的语义的对象几乎是不存在的。事实上,随着分类问题的不断复杂化,在医学、文本分类、基因工程、电影推荐等方面,一个实例往往可以关联一个标签集合(含不止一个标签),而不再是只与单个标签有关。比如,有的电影既可以属于“灾难”主题,也可以属于“爱情”主题。这时,类似场景的问题就可以借助多标签分类的技术解决。可以看到,多标签分类的范畴更符合现实场景,而单标签分类可以视为是多标签分类的特殊情况。 至于对象,多标签学习是从输出空间上来考察其多义性[9]的。组合标签形成的输出空间呈指数型增长以及建立多标签分类器的计算和存储资源的限制成为当前多标签学习发展的主要挑战之一,这就需要学习系统灵活巧妙地把握标签间的相关性[10]来应对。 2。2 多标签学习的定义与框架 为每个对象赋予一系列标签,用这些标签来明确表达对象包含的语义,用这个方法可以解决现实对象的多义性问题。 具体而言,对于多标签分类问题,假设标签空间,实例空间,其中是k维属性向量。可以定义多标签背景下的训练集,并且是拥有的标签集。从D中训练一个模型,使得对于标签未知的实例x,多标签分类器可以预测x拥有的合适标签集。 预测模型返回实值函数,其中可以看作实例具有标签的置信度[9]。对于实例,一般原则是在拥有的标签上映射的值较大,在未拥有的标签上映射的值较小。也可以设定阈值,多标签分类器可以由通过的形式来形成。 总体而言,多标签学习有以下特点[11]: (1) 标签的语义是事先定义的、明确的、可理解的。 (2) 标签集的规模是可数的,并且不能大于属性集的规模。 (3) 每个实例可同时与不止一个标签关联。 (责任编辑:qin) |