粗糙集-经济百科

粗糙集(Rough Sets)

什么是粗糙集

粗糙集是一种处理不精确、不确定和不完全数据的新的数学方法。它可以通过对数据的分析和推理来发现隐含的知识、揭示潜在的规律。在粗集理论中，知识被认为是一种分类能力。其核心是利用等价关系来对对象集合进行划分。

粗糙集理论提出了知识的约简方法，是在保留基本知识(信息)，同时保证对象的分类能力不变的基础上，消除重复、冗余的属性和属性值，实现对知识的压缩和再提炼。其操作步骤：(1)通过对条件属性的约简，即从决策表中消去某些列；(2)消去重复的行和属性的冗余值

粗糙集的特点

粗糙集最主要的特点是：它无需提供对知识或数据的主观评价，仅根据观测数据就能达到删除冗余信息，比较不完备知识的程度-粗糙度，界定属性间的依赖性和重要性的目的。

粗糙集的基本概念

粗糙集的基本概念有：

(1)信息系统。一般地,一个知识表达系统或信息系统可以表达成, 式中，为论域，它是全体样本的集合;为属性集合，其中子集是条件属性集，反映对象的特征，D为决策属性集，反映对象的类别；为属性集合，表示属性r的取值范围；为一个信息函数，用于确定U中每一个对象的属性值，即任一。
(2)不可分辨关系。当两个对象由相同的属性来描述时，这两个对象在该系统中被归于同一类，它们的关系称之为不可分辨关系，即对于任一属性子集，如果对象,,,当且仅当时，和是不可分辨关系，不可分辨关系简称等价关系。
(3)下近似集与上近似集。下近似集定义为：根据现有知识R，判断U中所有肯定属于X的对象所组成的集合，即，式中，表示等价关系R下包含关系x的等价类；上近似集定义为：根据现有知识R，判断U中一定属于和可能属于X的对象所组成的集合。

粗糙集与模糊集比较

粗糙集与模糊集都能处理不完备( IM PErfect) 数据, 但方法不同, 模糊集注重描述信息的含糊(vagueness) 程度, 粗糙集则强调数据的不可辨别( indiscern ib ility) , 不精确( imp recISIon) 和模棱两可 (am b igu ity). 使用图像处理中的语言来作比喻, 当论述图像的清晰程度时, 粗糙集强调组成图像象素的大小, 而模糊集则强调象素存在不同的灰度. 粗糙集研究的是不同类中的对象组成的集合之间的关系, 重在分类; 模糊集研究的是属于同一类的不同对象的隶属的关系,重在隶属的程度. 因此粗糙集和模糊集是两种不同的理论, 但又不是相互对立的, 它们在处理不完善数据方面可以互为补充.