1。3 中医学科与计算机学科的交叉
作为辅助性工具,计算机技术为金融学、生物学、医药学等许多学科的变革创造了机会。特别是机器学习等技术,带来的变革成效尤为显著。
数据挖掘一般是指利用分析算法从大量的表面数据中发现背后有价值的、人类感兴趣的信息的过程。数据的指数级增长是当下各行业信息化高速发展的特点,如何有效处理这些数据,提取有价值的信息,成为当务之急。在这个过程中,通常根据已有的数据建立预测模型,再对数据进行开发。这时候,就可以将机器学习与大量数据有机结合,形成新的交叉方向——数据挖掘。机器学习使计算机可以从数据中学习,建立和理想假设比较接近的现实假设,这是一个求解较优解的过程。机器学习可以赋予机器“方法论”,使机器具有自学的能力。
以挖掘数据背后的有效信息为导向,机器学习的相关技术在中医领域的应用也日益增多,典型的有肖光磊等人[6]以慢性胃炎作为应用背景,提出了基于遗传算法的正相关关联规则算法;李玉森等人[7]应用只有输入层,单个隐藏层和输出层的简单神经网络模型来诊断艾滋病患者,分析准确率高于85%,预测效果良好;李毅等人[8]聚类处理乙肝后肝硬化的数据,深入地探讨了乙肝后肝硬化背景下的症状组合及证型规律,最后总结出了相关的7类证型。
深入地讲,可以尝试将机器学习技术应用于中医领域,特别是用于探索“药药”、“药症”、“药证”、“症证”等相互关系。
1。4 多标签学习用于中医诊断帕金森病
多标签分类指一个实例可能同时属于多个类,这更加符合现实生活中遇到的问题,而这也已经成为研究热点之一。
帕金森病的数据集属于多标签数据集,症状(特征集)包括包括望、闻、问、切、舌5大项91小项,证型(标签集)包含痰热动风、血瘀动风、气血两虚、肝肾不足和阴阳两虚5类。单个病例(实例)可以同时含有不止一个证型(标签)。
将多标签学习的相关技术引入医学领域,特别是用来诊断病情,为后续的治疗提供可靠的依据,这样的想法已经被人们付诸于实践。而且这也是相互提高的过程,对诊断率的要求促使技术不断提高,技术的提高为人类的生命提供了保障。
聚焦于中医对帕金森病的诊断过程,显然,可以将症状属性作为特征,可能诊断证型作为标签集,那么就可以将多标签学习的相关算法引入到中医诊断帕金森病的领域中,既可以用于中医量表制定的规范化和客观化,促进中医理论的完善,也可以在减少或避免中医对患者证型的误判,提高诊断率发挥一定的作用。
本文会介绍多标签学习的研究现状,同时尝试借助多标签分类算法构建中医诊断帕金森病的预测系统,辅助中医诊断帕金森病。
1。5 文章结构
多标签分类作为时下机器学习范畴的探究热门,理论日趋成熟。将多标签技术用于中医对帕金森病的准确诊断,一方面可以推动中医量表的规范化和客观化,挖掘表层数据下蕴含的丰富信息,可以促进中医事业的健康发展,为人类造福;另一方面也可以减少或避免中医对患者证型的误判,提高诊断的准确率。
与一般的多标签数据不同的是帕金森病的证型分为主证型和次证型,那么实际考虑帕金森数据集的标签时,应该要考察不同标签间的权重分布,或者是一定的顺序关系,这也是多标签技术用于帕金森数据集的难点之一。但是本文没有区分主次,而是将所有证型都视为主证型。 面向中医诊断帕金森病领域多标签学习(4):http://www.youerw.com/jisuanji/lunwen_96845.html