4.4 基于模糊粗糙集的建模与学习

4.4.1 知识约减

传统的粗糙集理论是不确定性和不完备性建模的一个重要工具,但其处理模糊数据时存在很多缺点。我们将这种从数据中提取规则的技术推广到了模糊环境中,证明了传统粗糙集理论的一些关于核与约简的关系、上下近似与边界域的关系在模糊环境下仍然成立,并利用这些关系建立了一种抽取模糊规则的高效学习算法。模糊集理论与粗集理论的结合可生成一种混合的软计算技术,这种技术的关键是如何处理多个模糊属性约简的集成,挖掘出隐藏在部分容易忽略的约简中的有用信息。这种技术首先利用一个相似性度量发现模糊属性的多个约简,然后利用模糊决策树对每一个约简产生一组模糊规则,最后利用模糊积分作为融合工具得到决策结果。最终的结论是:在归纳偏执明确的前提下,其融合结构明显优于单独使用决策树算法或传统粗集约简的规则抽取方法。

4.4.2 模糊集合上下近似算子的构造

从数学角度来看,对模糊概念进行近似逼近就是求该模糊集合的上下近似算子。模糊集合的上下近似算子可总结为两种上近似和两种下近似算子,在无穷论域上利用构造性和公理化的方法对以上四种算子进行了总结性的研究,研究指出了即便是在有限论域模糊粗糙集与经典的粗糙集在基本性质上也有本质的区别,继而对其格结构和拓扑结构进行了刻画,指出了在模糊粗糙集的框架内哪种模糊集合可以起到经典粗糙集中与等价类相似的作用,证明了这四种算子具有与经典粗糙集类似的粒结构,说明了模糊粗糙集从粒结构的角度同样推广了经典粗糙集。

4.4.3 基于模糊粗糙集的增量属性约简

研究针对实数值数据提出了基于模糊粗糙集的属性约简的数学理论,包括给出了严格的属性约简的定义,利用辨识矩阵为工具深入细致地研究了属性约简的数学性质,在此基础之上给出了基于辨识矩阵极小元素的属性约简的快速算法。针对大容量数据集,研究开发了属性约简的增量算法。

4.4.4 核函数框架下的模糊粗糙集

由于模糊粗糙集中的核心概念模糊相似关系与机器学习中的核函数有密切的关系,因此从核函数的角度研究了模糊粗糙集及其应用。该研究首先针对二分类问题利用模糊粗糙集中下近似计算出的隶属度改进了软间隔和硬间隔的支撑向量机算法,提出了新的主动学习算法;研究提出了基于高斯核函数的模糊粗糙集的属性约简的理论与方法,并证明了每一个模糊相似关系都是一个Krein核,在Krein空间中对模糊粗糙集进行了几何解释,指出了下近似隶属度本质上就是Krein空间中的点到集合的距离,证明了针对模糊相似关系的Mercer定理,给出了对应于模糊相似关系的Krein空间的具体结构。