1 / 3
文档名称:

数据挖掘实习报告.docx

格式:docx   大小:18KB   页数:3页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据挖掘实习报告.docx

上传人:森森 2022/8/28 文件大小:18 KB

下载得到文件列表

数据挖掘实习报告.docx

文档介绍

文档介绍:数据挖掘实****报告
通过半年的实****我在这里得到了一次较全面的、系统的熬炼,也学到了很多书本上所学不到的学问和技能。以下是我这次的实****鉴定。
经验了实****对社会也有了基本的实践,让我学到了书本以外的学问,实****期间,我努力

数据挖掘实****报告
通过半年的实****我在这里得到了一次较全面的、系统的熬炼,也学到了很多书本上所学不到的学问和技能。以下是我这次的实****鉴定。
经验了实****对社会也有了基本的实践,让我学到了书本以外的学问,实****期间,我努力尽量做到理论与实践相结合,在实****期间能够遵守工作纪律,不迟到、早退,仔细完成领导交办的工作。在实****鉴定中,我参加了整个数据分析工作,从数据获得到数据清洗、数据报表的制定到模型的建立以及模型监控等等,让我充分学****了数据分析岗位的实际操作。
在实****初期,项目经理支配了我参加数据获得的相关工作,主要是编写SQL代码在linux上用Perl语言调用获得数据。起初觉得自己对SQL语言了解较多,以为这份工作特别简洁。但实际操作起来才知道,在数据量达到几百兆甚至上GB级别的时候,所学的SQL根本解决不了问题。经向项目经理学****这才知道了如何运用分层次操作等速度较快的SQL技巧。通过这两个月的实****充分相识到所学学问远远不够。
完成数据获得阶段之后,项目经理起先支配数据清洗以及数据报表制定的相关工作。接到这份工作之初,对数据清洗并没有太多的相识,以为许多都是根据《数据挖掘》教材中步骤进行就可以的。但经过项目经理指导之后才知道数据清洗之前首先要对项目业务进行肯定的了解,只有清楚了业务数据的来源、数据的实际意义才知道哪些数据可以称为极端值,哪些数据又是不正常的,制定报告或者交给模型分析师时须要去除的等等。同时,在制定数据报表的同时学****了许多excel函数的运用,***表的运用,PPT报告的书写等等。


在实****的后三个月,起先接触了模型的分析与监控。在学****机器学****以及《数据挖掘》书本时,总会想到各种各样的分类模型,也总会认为模型精确率高的模型才会是好模型。在运用统计模型之前,项目经理首先向实****生介绍了目前挖掘部门常用的分类模型以及详细的一些运用方法。其中逻辑回来模型、决策树模型是常用的分类模型,回来分析和时间序列模型是常用的预料模型,这与平日所学基本一样。正值新奇为什么不运用支持向量机以及神经网络模型之时,项目经理说,由于模型结果都是要给市场部门的同事报告的,所以模型结果最好能够简洁易懂的。在实际工作才知道,一般除了用模型精确率来衡量模型的效果外,还有例如灵敏度、ROC曲线、RA曲线等等指标值。而模型的操作过程也不是想象的那么简洁,并不是用