1 / 7
文档名称:

计算机科学与工程学院.doc

格式:doc   大小:182KB   页数:7页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

计算机科学与工程学院.doc

上传人:marry201208 2019/4/3 文件大小:182 KB

下载得到文件列表

计算机科学与工程学院.doc

文档介绍

文档介绍:计算机科学与工程学院人工智能(ArtificialIntelligence)大作业专业:姓名:学号:班级:完成日期:2011年6月5日目录1. 问题描述 7问题描述题目3:K-means算法分析Iris数据集难度:&&&&&(满分:90分)内容:k--means算法是根据聚类中的均值进行聚类划分的聚类算法。输入:聚类个数k,以及包含n个数据对象的数据。输出:满足方差最小标准的k个聚类。处理流程:;;(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分;(有变化)聚类的均值(中心对象)k-means算法的工作过程说明如下:首先从n个数据对象任意选择k个对象作为初始聚类中心,而对于所剩下的其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类。然后,再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值),不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数,具体定义如下:(1)其中E为数据库中所有对象的均方差之和,p为代表对象的空间中的一个点,mi为聚类Ci的均值(p和mi均是多维的)。公式(1)所示的聚类标准,旨在使所获得的k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。:聚类个数k,以及包含n个数据对象的数据。输出:满足方差最小标准的k个聚类。-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。k-means算法的工作过程说明如下:首先从n个数据对象任意选择k个对象作为初始聚类中心,而对于所剩下的其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类。然后,再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值),不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数,具体定义如下:(1)其中E为数据库中所有对象的均方差之和,p为代表对象的空间中的一个点,mi为聚类Ci的均值(p和mi均是多维的)。公式(1)所示的聚类标准,旨在使所获得的k个聚类具有以下特点:各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。-;;(中心对象),计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分;(有变化)聚类的均值(中心对象)-means算法流程图图1K--means