1 / 14
文档名称:

线性回归、逻辑回归.ppt

格式:ppt   大小:242KB   页数:14页
下载后只包含 1 个 PPT 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

线性回归、逻辑回归.ppt

上传人:1485173816 2018/12/5 文件大小:242 KB

下载得到文件列表

线性回归、逻辑回归.ppt

文档介绍

文档介绍:线性回归
当某种现象的变化及其分布特性清楚后,需分析是什么原因使这种变化发生,或某种现象对其他现象有什么影响等。如研究目的在探知两特性值与间的相互关系,如特性值可以自由变动,则可用各种测试方法研究的效应。但假如不能自由变动(例如预测台风或探求水稻穗与精米重量间的关系等问题时),可利用事先求得的与间的关系来推测值。但对与间的关系,需再加解析后才能拟定其相互间的关系。
回归用以叙述两个或两个以上变量间的关系。回归分析是以一个或多个自变量描述、预测或控制特定因变量的分析。回归分析主要在了解自变量与因变量间的数量关系。主要目的:
●了解自变量与因变量关系方向及强度。
●以自变量所建立模式对因变量作预测。
回归分析根据自变量个数的不同可以分为:
●简单回归分析。
●多元回归分析。
回归分析中变量的筛选原则:
●相关理论或逻辑。
●研究人员探讨变量关系来决定。
回归分析步骤:
●由分布情况或专业知识,推测变量间的数学模型。
●用最小平方法推导正则方程。
●决定回归方程。
●用图形证明所求的方程曲线与测定值的分布是否一致,以确定所选的数学模型是否全理。
假设简单回归模型可以用下式表示:
其中为因变量; 为自变量; 为误差项; 为
回归系数,其中为截距项, 为模型的斜率。

误差项代表我们所拟合的回归直线不可能很理想,
因此认为“直线模型”可能有错,误差项代表可能的错误
。回归模型假设的基本思想是误差项来自某一个正态分
布。严格来说,线性回归模型的基本假设为:
模型假设及参数估计
●正态性——对任一固定值, 服从
●独立性——和间相互独立
●线性性­——是的线性函数,即
●方差齐次——对于任意的,有
多元回归是简单线性回归的推广,模型包含一个因变量和两个或以上的自变量。例如,在研究“销售量”的变化时,只考虑“广告投资”可能不够,可能还要再考虑“销售人员的数量”、“特定产品的价格”、“个人可支配所得”等其他变量,此时采用多元回归分析是比较适当的。需要注意的是,如果因变量是类别变量(例如因变量“购买意向”为二分变量时,也就是表示肯定购买, 表示不一定购买),则要采取Logistic回归分析。
多元回归分析
多元回归分析可以达到以下目的:
●了解因变量和自变量之间的关系是否存在,以及该关系的强度。也就是以自变量所解释的因变量的变异部分是否显著,且因变量变异中有多大部分可以用自变量来解释。
●估计回归方程,求算特定已知自变量的情况下因变量的理论值或预测值,达到预测目的。
●评价特定自变量对因变量的贡献,也就是在控制其他自变量不变的情况下,该自变量的变化所导至的因变量变化情况。
●比较各自变量在拟合中对的回归方程中相对作用的大小,寻找最重要的和比较重要的自变量。
该模型可以用下面的回归方程来估计
其中, 代表截距, 代表回归系数(也就是偏回
归系数),一般都是通过常用的统计软件来估计,
统计软件还将同时给出标准的回归系数和对应的标
准误差,这些统计量与简单回归中给出的相应的统
计量的意义是一致的。
多元回归模型
变量的选择原则:
●依据专家所提出的相关理论,参考相关研
究文献。
●依据研究人员所欲探讨的变量关系来决定。

在建立回归方程时,可能会涉及很多自变量。然而有些变量可能并不重要,太多的变量会促使模型变量过于复杂;因此,需要对大量的自变量进行必要的筛选,用尽可能少的自变量去解释因变量中最大比例的变异。
回归变量的选择