1 / 8
文档名称:

2021年基于Logistic回归分析模型的足球彩票预计方法①中国足球彩票网.docx

格式:docx   大小:19KB   页数:8页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

2021年基于Logistic回归分析模型的足球彩票预计方法①中国足球彩票网.docx

上传人:非学无以广才 2021/3/25 文件大小:19 KB

下载得到文件列表

2021年基于Logistic回归分析模型的足球彩票预计方法①中国足球彩票网.docx

文档介绍

文档介绍:基于Logistic回归分析模型的足球彩票预计方法①中国足球彩票网

     摘 要:本文搜集了2021年—2021年意大利足球甲级联赛前30场比赛中得分、积分、主客场情况、净胜球数等数据,首先对数据做主成份分析,剔除影响不显著的变量,然后利用多分类Logistic回归方法,建立Logistic回归模型,预计比赛结果。结果显示:对2021年—2021意大利足球甲级联赛结果影响较大的是主客场,多分类Logistic回归模型判定正确率较高。
  关键词:Logistic回归分析模型 主成份分析 足球彩票
  中图分类号:F224 文件标识码:A 文章编号:1672-3791202107a-0198-04
  伴随中国足球彩票的发行,预计足球彩票结果一直是大家探讨的问题,以往的文件中也发觉了用不一样的方法预计竞猜结果。文件1~3采取不一样的数学模型方法讨论怎样愈加正确地预计所包括的比赛结果。Logistic回归通常以离散型的分类变量发生结果的概率为因变量,以影响原因为自变量建立模型。研究分类变量因变量和影响原因自变量之间关系的研究方法,属于概率型非线性回归方法。从足球比赛的通常情况来看,一场比赛的结果有三个:胜、平、负,因此对一场比赛的预计结果即因变量能够认为有三类。同时,比赛的结果除了受到球队实力的影响,还和比赛当初的天气、球队排名、球队状态、教练、球队主客场作战能力等原因相关。因此我们首先讨论怎样量化以上指标,并利用主成份分析找出影响比赛结果的关键原因,进而将这些关键原因作自变量,比赛结果作为因变量建立多分类Logistic回归分析模型,并利用该模型预计每场足球比赛结果。
  1 多分类Logistic回归模型
  当因变量是一个多分类指标,尤其是有序多分类指标时,如流行病学中一些慢性病的危险原因研究,观察结果为“无、轻、中、重”等不一样等级资料,能够采取多分类Logistic回归或有序多分类Logistic进行分析。
  本文用有序多分类Logistic回归预计2021年—2021年意大利足球甲级联赛结果。多分类Logistic回归是因变量为多项分类的资料,如足球联赛中的主场的结果可能是胜、平、负,这些结果通常全部按3、2、1等整数序列编码。在反应变量的各类中有明确的从低到高的排序,但相邻各类之间的差距未知。对序次测度反应变量建立模型的合适方法之一是累积回归模型,也称序次Logistic回归模型或百分比发生比模型。序次Logistic回归模型定义以下:
  其中表示观察现象内在趋势,它并不能被直接测量,而为误差项。
  当实际观察反应变量有种类别时,对应取值为,而且各取值之间的关系为,那么共有个未知门槛或分界点将各相邻类别分开。即:假如;假如;…;假如其中表示分界点,有个值,且有。在参数估量过程中,第一分界点通常定为0,这么能够降低一个参数估量。因为这种尺度的设定是随意的,所以开始或结束于任意次数字全部是可行的。因此,要求以后,将有个值需要估量。
  给定值的累积概率能够按以下形式表示:
  有了累积分布函数以后,既能够采取logit也能够采取probit作为对序次反应变量建模的关联函数。它们将产生累积Logistic回归模型,累积Logistic回归能够定义以下:
  .
  从上式能够看到,累积Lo