直觉模糊C均值聚类与图像阈值分割

最近在研究模糊聚类在图像处理中的应用,其中需要验证一种基于直觉模糊集的直觉模糊C均值聚类(IFCM)算法。直觉模糊决策是一种模糊信息的概念,把只考虑隶属度的经典模糊C均值聚类(FCM)推广为同时考虑真隶属度、假隶属度和犹豫度这三方面信息的直觉模糊集,同时引入一个新的参数即直觉模糊熵。相比经典模糊C均值聚类,使用直觉模糊集定义的模糊聚类可以收敛到一个更理想的聚类中心。模糊聚类广泛应用在控制、模式识别、信号处理、人工智能、决策等领域。本文使用FCM和IFCM算法进行图像分割,用于区分脑CT图像中的不同区域并识别大脑中的异常。

1.模糊理论的介绍

在日常生活中,有许多事物或多或少都具有模糊性,模糊虽难以捉摸,但却非常重要。模糊理论强调以模糊逻辑来描述现实生活中的事物,以弥补二值逻辑无法对不明确定义边界事物描述的缺点。人类的自然语言在表达上具有很大的模糊性,难以用二值逻辑来完全描述现实生活中的事物。故模糊理论将模糊概念以模糊集合的定义,将事件属于某集合程度的隶属函数加以模糊量化,得到隶属度,来处理问题。

模糊聚类就是用模糊数学的方法,把样本之间的模糊关系定量,从而客观准确地进行聚类,使得各个类之间的数据差别应尽可能大,,类内之间的数据差别应尽可能小,即最小化类间的相似性,最大化类内的相似性。而模糊C均值就是一种应用最广泛且较成功的模糊聚类方法。它通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到对样本进行分类的目的。

2.模糊理论的应用

1965年,Zadeh教授提出了著名的模糊集理论,创建了一个新的学科——模糊数学,主要包括模糊集合理论、模糊逻辑、模糊推理和模糊控制等方面的内容。其中模糊集合理论是对传统集合理论的一种推广,能较好的描述人类视觉中的模糊性,在模式识别的各个层次都可使用模糊集合理论。模糊理论主要解决在模式识别的不同层次出于信息不全面、不准确、含糊、矛盾等造成的不确定性问题。

2.1模糊聚类理论

基于模糊集合的特点,模糊聚类方法应运而生。聚类,就是将一组给定的未知类标号的样本分成内在的多个类别,使得同一类中的样本具有较高的相似度,而不同的类中样本差别大。聚类分析的目的是揭示和刻画数据的内在结构,其内容涉及统计学、生物学、以及机器学习等研究领域,并在模式识别、数据分析和挖掘、图像处理等领域获得了广泛的应用。

1973年,J.C. Bezdek提出了里程碑式的模糊C均值聚类算法(FCM)[1],通过引入样本到聚类中心的隶属度,使准则函数不仅可微,且软化了模式的归属。

在众多模糊聚类算法中,FCM算法应用最广泛且较成功,它通过优化目标函数得到每个样本点对所有类中心的隶属度,从而决定样本点的类属以达到自动对样本数据进行分类的目的。

2.1.1 FCM算法原理

根据聚类的数目C和一组包含n个L维向量的数据xk,用FCM算法输出元素的隶属度uij,它代表着数据xj是属于第i个类的概率,可以通过求下面式子(1)目标函数的最小值得到,通常取m=2。

其中,式(1)的约束条件为:

在(1)式的约束条件下,可以求得(1)中目标函数取最小值时相应的隶属度矩阵和聚类中心。通常,该最小值用极小值代替,因此分别对各变量求偏导,并令偏导数为0,联立并解出更新后的模糊隶属度和聚类中心,如下公式(2)(3)。

2.1.2 FCM算法流程

根据FCM的基本原理,总结出该算法的步骤如下:

1) 设置目标函数的精度e,模糊指数m(m通常取2)和算法最大迭代次数;

2) 初始化隶属度矩阵

或聚类中心

3) 由式(2)(3)更新模糊划分矩阵

和聚类中心

4) 若目标函数

则迭代结束;否则,跳转执行第三步;

5) 根据所得到的隶属度矩阵,取样本隶属度最大值所对应类作为样本聚类的结果,聚类结束。

图1给出FCM的算法流程图。

2.1.3 FCM算法的优劣

FCM算法优越于传统硬C均值聚类算法在于隶属度可以连续取值于 [0,1]区间,考虑到了样本属于各个类的“亦此亦彼”性,能够对类与类之间样本有重叠的数据集进行分类,具有良好的收敛性;而且FCM算法复杂度低,易于实现。然而,FCM也存在着不足之处,如目标函数在迭代过程中容易陷入局部最小、函数收敛速度慢、对初始值、噪声比较敏感等问题。下面从分析模糊C均值聚类划分矩阵的隶属度的含义、划分趋势出发,讨论一种可以改善FCM性能的算法——IFCM算法。在此之前需要引入新的概念,即直觉模糊集。

2.2 直觉模糊聚类理论

2.2.1 直觉模糊集简介

人生就是一场旅行,不在乎目的地,

直觉模糊C均值聚类与图像阈值分割

相关文章:

你感兴趣的文章:

标签云: