1 / 14
文档名称:

专业前沿讲座心得体会.doc

格式:doc   大小:21KB   页数:14页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

专业前沿讲座心得体会.doc

上传人:0640105 2020/4/18 文件大小:21 KB

下载得到文件列表

专业前沿讲座心得体会.doc

文档介绍

文档介绍:专业前沿讲座心得体会近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。机器学****和数据挖掘这些年一直是计算机应用方面研究的重点和热点,首先要了解什么是数据挖掘,简单地说,数据挖掘是从大量数据中提取或挖掘知识。我一直对这方面的知识颇感兴趣,这学期学院开设的学术前沿讲座的课程,很有幸听到了文益民教授对于自己在机器学****和数据挖掘方面研究的讲座,让我对这些知识有了深入浅出的理解,受益匪浅。12月5号,文益民教授做了题为“大规模数据的分类”的讲座,在讲座的最开始,文教授提到了戈登·德莱顿《学****的革命》一书,皆在指导我们如何积累知识如何思考如何学****如何去做研究,具有抛砖引玉的指导意义。在这之后,又对了解机器学****和数据挖掘首先要了解的知识做了简要的说明,比如对于问题的分类是分为线性问题和非线性问题;比如聚类的含义是将物理或抽象对象的集合分成由类似的比如对于这个世界上计算机的分;对象组成的多个类的过程类可以只分成工人(maker)和思考者(thinker)两类。至此正式进入问题的讨论。对于这次讲座,文教授从四个方面进行了讲授。第一,实际应用中的大规模数据分类问题。第二,大规模数据给机器学****带来的挑战。第三,大规模数据分类算法的研究。第四,展望发展前景。文教授主要是在第三点中做了很多工作也取得了可喜的成绩。在机器学****的实际应用中,大规模数据分类问题一般会应用在以下几个方面,在高速高精度的工业图像检测方面,在专利分类方面,在生物信息数据快速增长方面,在支持向量机参数选择方面。大规模数据给机器学****带来的问题有:1、算法一般不是收敛太慢就是难以收敛,训练时间过长。2、海量数据无法一次装入内存。3、算法可靠性得不到保证。4、已经训练好的学****器遇到心得训练样本时需要重新训练。在最重要的部分,文教授提到了几个重要的研究方法,包括算法,这里面包含有:1、基于并行计算的算法,2、以并行计算方法求解工作集方法中每个迭代步中二次规划的子问题,3、Meta-learning,最小最大模块化支持向量机以及快速模块化支持向量机,4、Cluster-SVM,Cluster-based-SVM,Cascade-SVM。文教授在第三和第四点中都有自己的工作和贡献,在第三点中,他提出了分类面拼接算法,在第四点中,提出了分层并行支持向量机训练算法。对于分类面拼接算法我进行了比较仔细的了解,并下载阅读了文教授于2017年3月份在湖南大学学报上发表的论文“基于分类面的快速模块化支持向量机研究”,对于分类面拼接算法有了初步的研究,下面说说我对这个算法的理解。信息采集和信息处理技术的快速发展导致了诸如公共健康数据、信用交易数据、国家经济普查数据、网络文本数据和地理信息数据等大规模数据集的产生。由于训练时间很长和空间需求很大,现有的大多数机器学****算法很难被直接用于大规模数据的机器学****这个算法是针对大多数现有的机器学****算法处理大规模问题时需要的训练时间很长和存储空间很大的难点而提出的,英文名是psfnrSVMs,在训练阶段,psfm2SVMs采用一簇平行超平面对大规模问题实施软划分,然后针对每个子问题并行训练支持向量机。在测试阶段,测试样本坐落于哪个子问题所在空间中,就由该子问题训练的支持向量机给出判别结果。在4个大规模问题上的实验表明:与采取硬划分的快速模块化支持向量机(fm2SVMs)相比,软划分能够使psfm2SVMs得到更加光滑的分类面,因而ps2fm2SVMs的泛化能力较高。在不增加训练时间的条件下,psfm2SVMs减少了由于训练集分割导致的分类器泛化能力下降。.支持向量机方法的本质是在训练集的一个高维像空间中寻找最大间隔分类超平面,这个分类超平面对应于训练集所在空间的一个光滑曲面。如果采用训练集分割的方法,将这个光滑曲面分段求出,然后进行连接,就可以得到这个光滑曲面的近似曲面。该算法使用平行超平面簇对训练集实施软划分,使得拼接后的分类面相比fm2SVMs得到的分类面更光滑,更接近最优分类曲面。因而,psfm2SVMs的泛化能力比fm2SVMs的泛化能力要高。在并行条件下,两者的训练时间和测试时间相同。在多核计算技术快速发展的今天,本文提出的算法,提供了一种可行的并行机器学****框架,对于研制高速高精度的机器学****算法具有一定的借鉴意义。未来计划研究随机向量w的方向对psfm2SVMs泛化能力的影响,并将该算法用于高速高精度工业图像检测。这就是我的心得体会,在讲座的最后,文教授还对机器学****和数据挖掘的未来进行了展望,诸如现在流行的云计算,还有动态数据流学****例外的发现,学****更复杂的函数,粒计算等等,都是今后发展的的

最近更新

2024年湖南网络工程职业学院单招职业适应性测.. 76页

2024年重庆电子工程职业学院职业倾向性测试题.. 56页

2024年铜陵职业技术学院单招职业适应性测试试.. 55页

一级建造师之一建公路工程实务题库1000道含答.. 302页

一级建造师之一建工程法规题库1000道及完整答.. 333页

安全员继续教育考试题库1000道含答案(最新).. 282页

演出经纪人之演出市场政策与法律法规题库400道.. 117页

演出经纪人考试题库1000道有答案 275页

2024年信阳艺术职业学院单招职业技能测试题库.. 75页

2024年常德职业技术学院单招职业技能测试题库.. 53页

2024年沈阳职业技术学院单招职业技能测试题库.. 74页

2024年石家庄工程职业学院单招综合素质考试题.. 76页

2024年重庆电讯职业学院单招职业适应性测试题.. 55页

2024年四川信息职业技术学院单招综合素质考试.. 58页

2024年山西青年职业学院单招综合素质考试题库.. 57页

2024年江苏省镇江市高职单招职业适应性测试题.. 75页

2024年石家庄工程职业学院单招职业技能测试题.. 57页

2024年重庆电子工程职业学院职业倾向性测试题.. 57页

综合解析广东深圳市高级中学物理八年级下册期.. 23页

综合解析山西太原市育英中学物理八年级下册期.. 22页

综合解析四川峨眉第二中学物理八年级下册期末.. 19页

综合解析北京市西城区育才学校物理八年级下册.. 22页

综合解析北京市朝阳区日坛中学物理八年级下册.. 21页

综合解析乌龙木齐第四中学物理八年级下册期末.. 21页

心内科护理培训ppt课件 26页

歌曲版权授权书范本 2页

国三柴油机燃油系统结构原理电控高压喷油系统.. 69页

设计院战略合作协议书(精选3篇) 8页

头疗养生 ppt课件 9页

学校规章制度高中学生学业评价管理办法 6页