1 / 29
文档名称:

机器学习降维算法课件.ppt

格式:ppt   大小:1,823KB   页数:29页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习降维算法课件.ppt

上传人:读书之乐 2019/9/4 文件大小:1.78 MB

下载得到文件列表

机器学习降维算法课件.ppt

文档介绍

文档介绍:机器学习_降维算法什么是降维?降维就是这样一个过程,在降低数据集维度的同时,保证其中包含的主要信息是相似的(就是保证有效信息不要丢失)。降维技术最典型的应用就是在机器学习问题中,进行有效的特征选择,以此获得更好的分类、回归效果。延迟符号为什么要降维?延迟符号降维?在机器学习中,如果特征值(也可称之为维度,或feature)过多,会引发维度灾难。维度灾难最直接的后果就是过拟合现象,进而导致分类识别的错误,因此我们需要对所提的特征进行降维处理。图基本模式识别过程降维后数据应该包含更多的信息?降维后会损失多少信息?降维后对分类识别效果有多大影响?问题降维的好处(1)进行数据压缩,减少数据存储所需空间以及计算所需时间。(2)消除数据间的冗余,以简化数据,提高计算效率。(3)去除噪声,提高模型性能。(4)改善数据的可理解性,提高学习算法的精度。(5)将数据维度减少到2维或者3维,​进行可视化。延迟符号延迟符号Contents降维方法0102特征选择FeatureSelection选择有效的特征子集,即去掉不相关或冗余的特征。特征选择后留下的特征值的数值在选择前后没有变化。也就是说,特征选择后的特征是原来特征的一个子集。特征抽取是指改变原有的特征空间,并将其映射到一个新的特征空间。也就是说,特征抽取后的新特征是原来特征的一个映射。特征抽取FeatureExtraction*降维算法可以根据所采用策略的不同而进行不同的分类降维算法分类延迟符号延迟符号主成分分析(PCA)ponentanalysis的缩写,即主成分分析。此方法目标是找到数据中最主要的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭露出隐藏在复杂数据背后的简单结构。主成分分析就是试图在力保数据信息丢失最少的原则下,对这种多变量的数据表进行最佳综合简化。这些综合指标就称为主成分,也就是说,对高维变量空间进行降维处理,从线性代数角度来看,PCA目标是找到一组新正交基去重新描述得到的数据空间,这个维度就是主元。向量的表示及基变换A(3,2)延迟符号去中心化现在问题来了:如果我们必须使用一维来表示这些数据,又希望尽量保留原始的信息,你要如何选择?例题:延迟符号下面是三维空间中的一组数据,很明显,数据的分布让我们很容易就能看出来主成分的轴(简称主轴)的大致方向。下面的问题就是如何通过数学计算找出主轴的方向。来看这张图:延迟符号

最近更新

傅里叶变换红外发射率谱的一种简易测量方法 2页

借鉴国外技术发展我国的锻压行业 2页

俄罗斯国立水文研究所代表团访华 2页

依靠技术进步 发展我国合金钢生产 2页

使用安全的农药制剂和施药技术的发展 2页

体系分类法中的模糊现象及其消除方法 2页

低碳马氏体在防滑链条上的应用 2页

低温技术在色谱-红外联用装置上的应用 2页

低低温电除尘技术的研究及应用 2页

传感器用电位器材料的寿命研究 2页

优化资源,提高化工三剂质量管理水平 2页

优化劳动组合 深化内部改革 2页

煤炭长期供应合同范本 7页

企业税收筹划应注意的问题及规避方法探讨 2页

热门商业区门面租赁合同样本 6页

演艺合同范本:演员聘用篇 7页

仪器装调用误差校正环作用分析 2页

港口仓储服务与货物报关代理合同 6页

从黑钨精矿硫酸体系中直接提取钨和钪的研究 2页

从蜂蜡中提取高纯三十烷醇—1的方法研究 2页

深圳汽车租赁合同范本 6页

从深井压裂工艺要求看我国压裂设备的现状与发.. 2页

从摩托车的新技术应用看产品开发方向 2页

从宁镇地区的构造-岩浆活化过程讨论金子运动的.. 2页

从区域范围讨论华北石炭二叠纪地层划分问题 2页

从三大功能出发探索包装设计理论 2页

介绍日本工业技术院发酵研究所概况 2页

消防工程清包合同模板 6页

消防人工劳务合同标准版 6页

人血浆载脂蛋白B——100抗原决定簇的研究 2页