1 / 29
文档名称:

机器学习降维算法课件.ppt

格式:ppt   大小:1,823KB   页数:29页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

机器学习降维算法课件.ppt

上传人:读书之乐 2019/9/4 文件大小:1.78 MB

下载得到文件列表

机器学习降维算法课件.ppt

文档介绍

文档介绍:机器学习_降维算法什么是降维?降维就是这样一个过程,在降低数据集维度的同时,保证其中包含的主要信息是相似的(就是保证有效信息不要丢失)。降维技术最典型的应用就是在机器学习问题中,进行有效的特征选择,以此获得更好的分类、回归效果。延迟符号为什么要降维?延迟符号降维?在机器学习中,如果特征值(也可称之为维度,或feature)过多,会引发维度灾难。维度灾难最直接的后果就是过拟合现象,进而导致分类识别的错误,因此我们需要对所提的特征进行降维处理。图基本模式识别过程降维后数据应该包含更多的信息?降维后会损失多少信息?降维后对分类识别效果有多大影响?问题降维的好处(1)进行数据压缩,减少数据存储所需空间以及计算所需时间。(2)消除数据间的冗余,以简化数据,提高计算效率。(3)去除噪声,提高模型性能。(4)改善数据的可理解性,提高学习算法的精度。(5)将数据维度减少到2维或者3维,​进行可视化。延迟符号延迟符号Contents降维方法0102特征选择FeatureSelection选择有效的特征子集,即去掉不相关或冗余的特征。特征选择后留下的特征值的数值在选择前后没有变化。也就是说,特征选择后的特征是原来特征的一个子集。特征抽取是指改变原有的特征空间,并将其映射到一个新的特征空间。也就是说,特征抽取后的新特征是原来特征的一个映射。特征抽取FeatureExtraction*降维算法可以根据所采用策略的不同而进行不同的分类降维算法分类延迟符号延迟符号主成分分析(PCA)ponentanalysis的缩写,即主成分分析。此方法目标是找到数据中最主要的元素和结构,去除噪音和冗余,将原有的复杂数据降维,揭露出隐藏在复杂数据背后的简单结构。主成分分析就是试图在力保数据信息丢失最少的原则下,对这种多变量的数据表进行最佳综合简化。这些综合指标就称为主成分,也就是说,对高维变量空间进行降维处理,从线性代数角度来看,PCA目标是找到一组新正交基去重新描述得到的数据空间,这个维度就是主元。向量的表示及基变换A(3,2)延迟符号去中心化现在问题来了:如果我们必须使用一维来表示这些数据,又希望尽量保留原始的信息,你要如何选择?例题:延迟符号下面是三维空间中的一组数据,很明显,数据的分布让我们很容易就能看出来主成分的轴(简称主轴)的大致方向。下面的问题就是如何通过数学计算找出主轴的方向。来看这张图:延迟符号

最近更新

逆流色谱技术在手性分离方面的应用 3页

放射性废料减量化与资源化-全面剖析 26页

运用信息技术提高中国食品安全管理的思考 3页

辽宁省气象资料业务系统(MDOS)常见疑误数据信.. 3页

高中感恩父母演讲(21篇) 35页

输电线路施工管理中存在的问题探究 3页

讲课心电图基本知识PPT课件 97页

超长异形防火卷帘同步控制技术攻关 3页

超产权论下股权激励对公司绩效影响的实证研究.. 3页

贵州民族体育旅游产业与民族健身操赛事协同创.. 3页

负载均衡技术及应用部署模式探讨 4页

试论汽车安全驾驶及应急处置技术 3页

议题设置推动智库国际化发展的实证研究 3页

解读课标 解析教材——帮助小学生积累数学基.. 3页

表分区技术在自动气象站数据存储中的应用 3页

药品生产流通行业存在问题的原因分析及政策取.. 3页

花生豆芽制作方法 3页

2025年度个人劳动合同模板定制化开发合同 8页

船舶发电柴油机缸内积液故障分析与排除 3页

脱硫橡胶沥青及其混合料性能研究 4页

聚碳酸亚丙酯凝聚洗涤新工艺研究 3页

考虑通信模式研究的输电线路在线监测技术分析.. 3页

美丽乡村背景下生态治理模式探究 3页

网易云音乐的电子商务营销策略及效果分析 3页

综合试验分布式协同控制管理技术 3页

经济法对社会整体利益的维护路径的探究 3页

纳豆激酶生产菌BSNK-5鉴定及发酵条件优化 3页

紫外激光作用频率对吸收玻璃的微孔加工研究 3页

粉煤灰代矿粉拌制沥青混凝土路面施工技术 3页

稠油采出含聚污水微生物处理研究 3页