图3.2 药物剂量处理流程
3.1.3.1 离散化数值
提取药剂量中的数值信息,对其按照公式(3.1)计算。
(3.1)
对于剂量单位为kg的,换算成以g为单位。
3.1.3.2 剂量聚类
分析剂量时,我们用“L(低)、M(中)、H(高)”3个模糊区域来表示药剂用量。选择K-均值方法对每药的剂量进行聚类分析,取K=3。由于具体到每一药的剂量值数据量较小,并且存在噪声数据,所以对初次聚成的聚类中心需要进行合理性判定,如果判断出不合理则去除干扰数据重新聚类。算法伪代码如表3.5。
输入:所有方剂fangji和病案bingli中所有出现的药物yaowu和剂量jiliang
输出:每个药物和对应的聚类中心centers
算法:
Foreach(yaowus and jiliangs in fangjis) AddToHashTable(yaowu,jiliang);
Foreach(yaowus and jiliangs in bingans)AddToHashTable(yaowu,jiliang);
Foreach(yaowu in HashTable){
Int count=CountJiliang(yaowu);
If(count>2){//至少出现3个剂量才处理
centers=Kmeans.Run(3,jiliangs);
If(membercount of maxcenter <2 && maxcenter>mincenter*10)//需要重新聚类
{ Jiliangs remove the max value;
centers=Kmeans.Run(3,jiliangs);
}}}
表3.5 剂量聚类算法伪代码
聚类结果示例见表3.6。
药名 当归 白芍
剂量中心L(g) 5.27 9.68
剂量中心M(g) 11.53 16.64
剂量中心H(g) 90 56
表3.6 药物剂量聚类示例
3.1.3.3 剂量模糊化
1965年美国学者Zadeh定义了模糊集合,使人们从确定性集合跨进了对不确定性集合的研究,在此基础上产生了模糊数学理论,并广泛应用于各个领域。
定义2.1 设U为论域, 是U 到[0,1]的映射,则以 为隶属函数确定了论域U上的一个模糊子集 。 。当且仅当 只取0或1时,模糊集 退化为经典集合。
经典集合可以通过隶属函数转换成模糊集,常用的隶属函数有三角函数,梯形函数等。本实验设计了基于三角函数的隶属函数,通过待定系数法得到隶属函数f(x),其中模糊集L、M、H的曲线如图3.3所示。
图3.3 剂量模糊集曲线 a:模糊集L, b:模糊集M, c:模糊集H
模糊集函数分别如下:
模糊集L:模糊集M:模糊集H:
综合以上三式得隶属度函数为
剂量模糊处理结果示例如表3.7,以麻黄汤为例。
组成药物 麻黄 桂枝 杏仁尖 甘草炙
药物代码 40113 40004 40093 40088
绝对剂量(g) 9 6 6 3
模糊剂量 1.000M 0.972L +0.028M 0.999L +0.001M 1.000L
表3.7 麻黄汤方剂预处理后结果
3.2 关联分析
中药功效是对药物治疗作用的高度概括,是通过药物作用于机体后,对其生理功能和病理变化所产生的不同调节效应而被人们所认识,并通过简洁的术语加以表达。所以研究不同功效表述之间的关系是中药功效规范以及方剂功效规约研究中的一个基本而重要的问题。关联规则算法善于从大量无规则项目集合中挖掘出具有关联性的项目,本部分描述了使用关联规则挖掘中药功效之间的关联性,以及中药功效与归经的关联性,为后续的功效相似研究与处方功效筛选提供数据基础。 肺癌中医治疗特点的数据挖掘研究+文献综述(7):http://www.youerw.com/jisuanji/lunwen_3678.html