1 / 22
文档名称:

基于遗传算法的特征选择研讨.ppt

格式:ppt   页数:22页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

基于遗传算法的特征选择研讨.ppt

上传人:今晚不太方便 2016/7/20 文件大小:0 KB

下载得到文件列表

基于遗传算法的特征选择研讨.ppt

相关文档

文档介绍

文档介绍:College of Mathematics puter Science College of Mathematics puter Science 基于遗传算法的特征选择基于遗传算法的特征选择 College of Mathematics puter Science College of Mathematics puter Science ? What ? Why ? How College of Mathematics puter Science College of Mathematics puter Science 回答什么是遗传算法?什么是特征选择? ,搜索优化问题最优解的一种算法。它采用群体搜索策略,一代一代逐步进化,直到收敛到问题的最优解。 ,个体模拟一个问题的一个解。关键问题: ? 方法:问题编码 ? 方法:遗传操作 ? 方法:适应度函数? What College of Mathematics puter Science College of Mathematics puter Science 什么是特征选择? 就是从一个特征集合中选择一个最优子集。 College of Mathematics puter Science College of Mathematics puter Science 遗传算法流程图? How College of Mathematics puter Science College of Mathematics puter Science 1. 问题编码对于特征选择问题,问题编码很简单,采用 0-1 编码即可。任何一个 n元 0-1 串,都表示问题的一个解。 2. 如何产生下一代通过选择、交叉、变异三种遗传操作产生下一代,前两种操作每一次都要用的,而第三种则不一定,但没有规则。选择是用来选择交叉的父本,交叉(模拟有性繁殖)产生新的个体,变异是某一位的变异。 ,对于特征选择问题可采用如下的类别可分离性准则,设计适应度函数。 College of Mathematics puter Science College of Mathematics puter Science 适应度函数为????????? w bDS S trJ需要注意的是这种适应度函数,只适用于连续值数据库的情况。下面如何计算? College of Mathematics puter Science College of Mathematics puter Science Iris 数据库 College of Mathematics puter Science College of Mathematics puter Science 选择的特征子集应使类内散度尽可能小,而使类间散度尽可能大. 设x k (i)和x l (j) 分别为? i 类和? j 类中的 D 维特征向量, ?(x k (i) , x k (j))为这两个向量间的距离,则类间平均距离为: College of Mathematics puter Science College of Mathematics puter Science 其中, P i和P j为先验概率。通常采用欧氏距离: J D称为各类之间的平均平方距离。定义类均值向量为和总均值向量分别为: 和