RETE算法并行化改进及在大规模规则匹配场景中的应用(3)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

RETE算法并行化改进及在大规模规则匹配场景中的应用(3)


2.2.3  特殊数据处理
1.关于瑕疵数据以及其不确定性推理:在许多场景之下,产生式系统对问题领域已经表现得很成功,可以用基于逻辑的语言表示这些领域的知识。一个传统逻辑中的问题,判别结果不是正确就是错误。但是在现实生活中,许多问题是比较模糊的或不明确的,也就是说问题本身就是不怎么准确,我们把这种问题本身称之为瑕疵数据。例如,有这么一条规则“如果成绩好,那么容易拿到高薪”,那么规则中“成绩好”“容易”“高薪”这些概念,在产生式系统中就不能被精确的表达出来。在这种情况下,最初的RETE算法就变得非常没有优势,因为RETE算法的语义表达能力是非常有限的。因此就必须对RETE算法进行改进,以便于处理这种瑕疵数据和逻辑的不确定性。
2.数据不断变化与机器学习:除了数据瑕疵之外,RETE算法还需要解决快速变化的数据。RETE算法的当前状态是通过保存临时匹配的结果来记录的,临时匹配结果即在alpha存储区和beta存储区中。网络中每个结点的事实都记录在了该结点对应的存储区中。如果事实数据是处于不断变化之中,就要不断改变alpha存储区以及beta存储区之中对应的存储数据,这样会导致大量的修改计算,造成RETE算法失去了它快速高效的匹配优势。当前一种解决方法是通过决策树学习算法[7]从大量数据之中学习规则。这种方法从根本上说,并不是对RETE算法的进化,但是在解决数据不断变化的问题时,它是通过机器学习的方法从数据中获取规则,这对RETE算法的改进是有一定的意义的。 (责任编辑:qin)