1 / 13
文档名称:

专业前沿讲座心得体会.doc

格式:doc   大小:60KB   页数:13页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

专业前沿讲座心得体会.doc

上传人:小雄 2020/6/11 文件大小:60 KB

下载得到文件列表

专业前沿讲座心得体会.doc

文档介绍

文档介绍:专业前沿讲座心得体会近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。机器学****和数据挖掘这些年一直是计算机应用方面研究的重点和热点,首先要了解什么是数据挖掘,简单地说,数据挖掘是从大量数据中提取或〃挖掘〃知识。我一直对这方面的知识颇感兴趣,这学期学院开设的学术前沿讲座的课程,很有幸听到了文益民教授对于自己在机器学****和数据挖掘方面研究的讲座,让我对这些知识有了深入浅出的理解,受益匪浅。12月5号,文益民教授做了题为“大规模数据的分类”的讲座,在讲座的最开始,文教授提到了戈登•德莱顿《学****的革命》一书,皆在指导我们如何积累知识如何思考如何学****如何去做研究,具有抛砖引玉的指导意义。在这之后,又对了解机器学****和数据挖掘首先要了解的知识做了简要的说明,比如对于问题的分类是分为线性问题和非线性问题;比如聚类的含义是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程;比如对于这个世界上计算机的分类可以只分成工人(maker)和思考者(thinker)两类。至此正式进入问题的讨论。对于这次讲座,文教授从四个方面进行了讲授。第一,实际应用中的大规模数据分类问题。第二,大规模数据给机器学****带来的挑战。第三,大规模数据分类算法的研究。第四,展望发展前景。文教授主要是在第三点中做了很多工作也取得了可喜的成绩。在机器学****的实际应用中,大规模数据分类问题一般会应用在以下儿个方面,在高速高精度的工业图像检测方面,在专利分类方面,在生物信息数据快速增长方面,在支持向量机参数选择方面。大规模数据给机器学****带来的问题有:1、算法一般不是收敛太慢就是难以收敛,训练时间过长。2、海量数据无法一次装入内存。3、算法可靠性得不到保证。4、已经训练好的学****器遇到心得训练样本时需要重新训练。在最重要的部分,文教授提到了几个重要的研究方法,包括算法,这里面包含有:1、基于并行计算的算法,2、以并行计算方法求解工作集方法中每个迭代步中二次规划的子问题,3>Meta-learning,最小最大模块化支持向量机以及快速模块化支持向量机,4、Cluster-SVM,Cluster-based~SVM,Caseade-SVM。文教授在第三和第四点中都有自己的工作和贡献,在第三点中,他提出了分类面拼接算法,在第四点中,提出了分层并行支持向量机训练算法。对于分类面拼接算法我进行了比较仔细的了解,并下载阅读了文教授于2017年3月份在湖南大学学报上发表的论文“基于分类面的快速模块化支持向量机研究”,对于分类面拼接算法有了初步的研究,下面说说我对这个算法的理解。信息采集和信息处理技术的快速发展导致了诸如公共健康数据、信用交易数据、国家经济普查数据、网络文本数据和地理信息数据等大规模数据集的产生。由于训练时间很长和空间需求很大,现有的大多数机器学****算法很难被直接用于大规模数据的机器学****这个算法是针对大多数现有的机器学****算法处理大规模问题时需要的训练时间很长和存储空间很大的难点而提出的,英文名是psfnrSVMs,在训练阶段,psfm2SVMs采用一簇平行超平面对大规模问题实施软划分,然后针对每个子问题并行训练支持向量机。在测试阶段,测试样本坐落于哪个子问题所在空间中,就由该子问题训练的支持向量机给出判别结果。在4个大规模问题上的实验表明:与采取硬划分的快速模块化支持向量机(fm2SVMs)相比,软划分能够使psfm2SVMs得到更加光滑的分类面,因而ps2fm2SVMs的泛化能力较高。在不增加训练时间的条件下,psfm2SVMs减少了由于训练集分割导致的分类器泛化能力下降。支持向量机方法的本质是在训练集的一个高维像空间中寻找最大间隔分类超平面,这个分类超平面对应于训练集所在空间的一个光滑曲面。如果采用训练集分割的方法,将这个光滑曲面分段求出,然后进行连接,就可以得到这个光滑曲面的近似曲面。该算法使用平行超平面簇对训练集实施软划分,使得拼接后的分类面相比fm2SVMs得到的分类面更光滑,更接近最优分类曲面。因而,psfm2SVMs的泛化能力比fm2SVMs的泛化能力要高。在并行条件下,两者的训练时间和测试时间相同。在多核计算技术快速发展的今天,本文提出的算法,提供了一种可行的并行机器学****框架,对于研制高速高精度的机器学****算法具有一定的借鉴意义。未来计划研究随机向量W的方向对psfm2SVMs泛化能力的影响,并将该算法用于高速高精度工业图像检测。这就是我的心得体会,在讲座的最后,文教授还对机器学****和数据挖掘的未来进行了展望,诸如现在流行的云计算,还有动态数据流学****例外的发现,学****更复杂的函数,粒计算等等,都是今后发展的

最近更新

2024年小学英语教学工作总结集锦15篇 55页

2024年小学老师评语 59页

咖啡酸苯乙酯衍生物对化学性肝损伤小鼠的保护.. 2页

2024年小学美术教师述职报告(通用12篇) 28页

周口北郊垃圾场地下水污染风险评价的开题报告.. 2页

吸附凝聚除砷的中试与工程应用研究的开题报告.. 2页

2024年小学红领巾广播稿15篇 41页

含流体多孔材料细观力学与多场耦合力学的开题.. 2页

实用的建筑合同模板5篇 22页

同轴旋转圆台间流体流动的动力学研究的开题报.. 2页

实用的住房申请书集合7篇 9页

吉利汽车X工厂总装物流仓库规划的开题报告 2页

第十四章身体各部位损伤 65页

2024年小学生自我评价范例[15篇] 12页

2024年小学生自我介绍5分钟优秀范文 7页

第十五课在医院看病 52页

2024年小学生盼春节作文 6页

第十二章酮和醛核磁共振谱习题解答 29页

2024年小学生犯错保证书关于学生犯错的保证书.. 3页

2024年小学生演讲稿必备(8篇) 12页

变电站状态转换风险管控及风险信息库设计的开.. 2页

受腐蚀高速铁路箱梁抗弯性能试验与数值模拟研.. 2页

第十七章一节心肺复苏最新 12页

反应磁控溅射制备TiAlON选择性吸收薄膜的研究.. 2页

2024年小学生心理健康特色活动策划方案(通用.. 32页

155 mm火炮不同膛线结构与弹带作用力研究 2页

县级医院二甲复审卫生部医院评审临床科室督导.. 11页

2023年同等学力申硕法学学科综合水平考试真题.. 6页

缺血性肠病教学查房 54页

师德师风问题整改台帐 8页