1 / 13
文档名称:

数据仓库与数据挖掘.doc

格式:doc   大小:2,879KB   页数:13页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据仓库与数据挖掘.doc

上传人:birth201208 2019/6/25 文件大小:2.81 MB

下载得到文件列表

数据仓库与数据挖掘.doc

文档介绍

文档介绍:实验报告课程名称数据仓库库与数据挖掘实验项目数据仓库的OLAP技术实践实验仪器SQLServer2008R2系别计算机学院专业计算机科学与技术班级/学号计科1101/2011011049学生姓名实验日期2014-04-14成绩指导教师北京信息科技大学计算机学院(课程上机)实验报告实验课程名称:数据仓库与数据挖掘专业:计算机科学与技术班级:计科1101学号:2011011049姓名:成绩:实验课程名称:数据仓库与数据挖掘专业:计算机科学与技术班级:计科1101学号:2011011049姓名:郭文林成绩:实验名称数据仓库的OLAP技术实践实验地点教二301实验室实验时间2014-04-14实验目的:1)掌握决策树模型的基本概念和计算方法,并用其预测三国表中“身份属性”与其他属性的关系;2)掌握贝叶斯分类器的基本概念,并用其预测三国表中“身份属性”与其他属性的关系;3)掌握关联规则的基本概念和种类,并用其预测“肾细胞癌转移情况”。4)对比以上三种模型,分析其联系与区别。实验内容:1)使用决策树模型预测三国表中“身份属性”与其他属性间的关系;2)使用贝叶斯模型预测三国表中“身份属性”与其他属性间的关系;3)使用关联规则预测肾癌表中“肾细胞癌转移情况”;4)对比分析决策树模型,贝叶斯模型和关联规则模型。5)谈谈你对三种模型在实践中的应用。实验要求:1)掌握决策树模型;2)掌握贝叶斯模型;3)掌握关联规则模型;4)自学其他数据挖掘模型。实验准备:实验所需的Excel数据和MSS2008R2软件。实验过程:一、使用决策树模型预测三国表中“身份属性”与其他属性间的关系;材料:。软件:SQLServer2008R2基本步骤:将三国表导入到SQL数据库,具体步骤如《实验一》所示。建立“AnalysisService”项目。打开“SQLServerBusinessIntelligenceDevelopmentStudio”,选择“文件(F)”à“新建(N)”à“项目”;在“新建项目”选项卡的“VisualStudio已安装的模板”中,选择“AnalysisService项目”,并设置项目的“名称(N)”和“位置(L)”,如将名称设置为“Test2”,最后单击“确定”按钮即可新建一个SSIS项目。打开安装目录“MicrosoftSQLServer2008R2\配置工具”下的“SQLServer配置管理器”,分别将“SQLServer(MSSQLSERVER1)”、“SQLServerAnalysisServices(MSSQLSERVER1)”、“SQLServerBrowser”服务启动,并将“登陆身份为”均设置“LocalSystem”。在VS中,选择“项目(P)”à“属性(P),在“Test2属性页”选项卡的“配置属性”à“部署”中,将默认的服务器“localhost”,更改为步骤1)中所设置的服务器名\实例名,该例中即A03\MSSQLSERVER1,然后点击“应用”,最后单击“确定”。建立数据源在“解决方案资源管理器”窗口,右击项目名下的“数据源”,选择“新建数据源”,进入“数据源向导”界面。单击“下一步”按钮,再单击“新建”按钮,进入“连接管理器”界面。单击“服务器名(E)”的下拉列表,选择步骤1)中所使用的服务器,该例中即为“A03”;单击“选择或输入一个数据库名(D)”的下拉列表,选择步骤1)中所使用的数据库,该例中即为“Mydatabase”;点击“确定”按钮退回到“数据源向导”界面。单击“下一步”按钮,在“模拟信息”选项卡中选择“使用服务账户(Y)”,单击“下一步”按钮,单击“完成”按钮。建立数据源视图在“解决方案资源管理器”窗口,右击项目名下的“数据源视图”,选择“新建数据源视图”,进入“数据源视图向导”界面。单击“下一步”按钮,在“关系数据源(R)”中选择所使用的数据库,该例子中使用“Mydatabase”。单击“下一步”按钮,将“可用对象(A)”中的表移入“包含的对象(I)”中,单击“下一步”按钮,再单击“完成”按钮。建立数据挖掘结构在“解决方案资源管理器”窗口,右击项目名下的“挖掘结构”,选择“新建挖掘结构”,进入“挖掘结构向导”界面。单击“下一步”按钮,选择“从现有关系数据库或数据仓库(D)”.单击“下一步”按钮到数据挖掘技术部分,选择“Microsoft决策树”后,单击“下一步”按钮。选择所要用数据的数据库位置后,单击“下一步”按钮。选择要使用的数据表,单击“下一步”按钮。选择所需的“索引键”、“输入变量”、“预测变量”;以“序列号码”为键值,“身份”为预测变量,并单击“建议”按钮以了解预测变量与其他变量间的相关性,可找出较具影响力的输入变量,完成后单击“确定”按钮,这时会回到原来的页面