1 / 10
文档名称:

球队数据挖掘实训论文.doc

格式:doc   大小:211KB   页数:10页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

球队数据挖掘实训论文.doc

上传人:yzhlya 2016/12/24 文件大小:211 KB

下载得到文件列表

球队数据挖掘实训论文.doc

文档介绍

文档介绍:1 基于因子分析的影响 NBA 热火队上赛季成绩的几个主要因素的数据挖掘摘要:该文首先简介了因子分析理论及分析步骤,然后举例说明如何使用 SPSS 统计软件对NBA 热火队上赛季成绩是进行因子分析,分析数据, 挖掘出球队的潜在能力, 从而帮助球队在以后的比赛中取得更好的成绩。一、引言球队成绩分析是整个比赛过程的一个重要环节。它对于教练来说是一件必须要做的事情,但是它也是一件复杂的事情。每个赛季教练都能获得很多球队和队员的数据,那么我们该如何从这些数据中获得对比赛有用的信息呢?我们该怎样从这些数据中挖掘出球队的潜在能力呢?因子分析是研究如何以最少的信息的丢失,将众多的原始变量浓缩成少数几个因子变量,以及如何使因子变量具有较强的解释性的一种多元统计分析方法。也就是说利用少数的几个公共因子,即挖掘出数据的共性,去解释较多需观测的变量中存在的复杂关系。因此我们可以利用因子分析方法的这一特性来分析球队的各项数据,找出少数隐含的公共因子来解释球队的各项数据, 进而分析球队的潜在能力。 SPSS 是世界上最早的,也是目前最好的统计软件,所以我们使用 SPSS 这一统计软件来对球队成绩进行因子分析。二、因子分析我们观测的变量之间往往存在相关性,那么变量之间为何会有相关性呢? 这是因为往往有一些共同的因子支配着这些相关的变量。例如,随着年龄的增长, 儿童的身高、体重会随着变化,具有一定的相关性;身高和体重之间为何会有相关性呢?因为存在着一个同时支配或影响着身高与体重的生长因子。那么,我们能否通过对多个变量的相关系数矩阵的研究,找出同时影响或支配所有变量的共性因子呢?因子分析就是从大量的数据中“由表及里”、“去粗取精”,寻找影响或支配变量的多元统计方法。因子分析正是基于信息损失最小化而提出的一种非常有效的方法。它把众多的指标综合成几个为数较少的指标,这些指标即因子指标。因子的特点是:第一,因子变量的数量远远少于原始变量的个数;第二, 2 因子变量并非原始变量的简单取舍,而是一种新的综合;第三,因子变量之间没有线性关系;第四,因子变量具有明明解释性,可以最大限度地发挥专业分析的作用。因子分析是把每个原始变量分解成两个部分:一部分是由所有变量共同具有的少数几个因子构成的,即所谓公共因子;另一部分是仅对某一个变量产生影响,为某一个变量所特有的,即所谓特殊因子。基于这样的假设,相应的因子模型为:设有 p个 pxxx,,, 21?为可观测的随机变量,每个变量可作如下分解: 1m1212 1 11 1?????????FFFX m? 2m2222 121 2?????????FFFX m?…… pm pppFFFX????????? mp2211?上式为因子模型,其中 mFFF,,, 21?为公共因子, p???,,, 21?为特殊因子, ij?( i=1~p , j=1 ~m )为因子载荷;数学上可以证明,因子载荷 ij?就是第 i变量与第 j因子的相关系数,反映了第 i变量在第 j因子上的重要性。在因子模型中,公共因子 mFFF,,, 21?之间互不相关,特殊因子 p???,,, 21?之间互不相关, 都是独立的,相互之间是没有关的。特殊因子与公共因子互不相关。特殊因子与被测原始变量相关。因子载荷 ij?表示了公共因子 jF 对第 i个变量 i?的影响程度,即 i?对 jF 的