1 / 25
文档名称:

软件开发人员的薪金.doc

格式:doc   大小:2,086KB   页数:25页
下载后只包含 1 个 DOC 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

软件开发人员的薪金.doc

上传人:文艺人生 2023/3/25 文件大小:2.04 MB

下载得到文件列表

软件开发人员的薪金.doc

文档介绍

文档介绍:该【软件开发人员的薪金 】是由【文艺人生】上传分享,文档一共【25】页,该文档可以免费在线阅读,需要了解更多关于【软件开发人员的薪金 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。软件开发人员的薪金
2
软件开发人员的薪金
摘要
本文所要解决的是研究软件开发人员的薪金与他们的资历、管理责任、教育程度等之间的关系,建立一个模型,以便分析公司人事策略的合理性,并作为新聘人员薪金的考虑。根据题设条件,结合实际情况,建立线性回归模型,方程表达式:
其中,,,,是回归系数,ε为随机误差,,,,分别为资历、管理水平和教育程度。结合题目所给的数据,运用matlab软件的命令rearess,求出了软件开发人员的薪金与资历、管理水平、教育水平之间的线性回归方程:
分析后同时运用残差分析法发现模型的缺陷,改进影响软件开发人员薪金的因素,改变模型,使得管理责任因素和教育程度因素对薪金是交互作用的,这样合理化模型后,得出了影响软件开发人员薪金因素的最佳多元回归模型。建立回归方程:
并用运用matlab软件得出了该模型的较准确的解:
并对回归方程和各个因素运用残差分析法进行了显著性检验,去掉异常数据后,在运用matlab软件求解,得出更为准确的解:
再次运用残差分析法对模型进行检验,说明模型可用。
综上所述,本文对数据进行深入分析,运用MATLAB软件画图,制作表格,更形象地反映数据,简单明了,运用残差分析法对模型进行检验,说明模型可用。
关键字:线性回归模型ressess残差分析法
3
5
11767
1
0
3
28
22184
8
1
3
6
20872
2
1
2
29
13548
8
0
1
7
11772
2
0
2
30
14467
10
0
1
8
10535
2
0
1
31
15942
10
0
2
9
12195
2
0
3
32
23174
10
1
3
10
12313
3
0
2
33
23780
10
1
2
11
14975
3
1
1
34
25410
11
1
2
12
21371
3
1
2
35
14861
11
0
1
5
13
19800
3
1
3
36
16882
12
0
2
14
11417
4
0
1
37
24170
12
1
3
15
20263
4
1
3
38
15990
13
0
1
16
13231
4
0
3
39
26330
13
1
2
17
12884
4
0
2
40
17949
14
0
2
18
13245
5
0
2
41
25685
15
1
3
19
13677
5
0
3
42
27837
16
1
2
5
20
15965
5
1
1
43
18838
16
0
2
21
12366
6
0
1
44
17483
16
0
1
22
21351
6
1
3
45
19207
17
0
2
23
13839
6
0
2
46
19346
20
0
1
模型假设
薪金自然随着资历(年)的增长而增加;
管理人员的薪金应高于非管理人员;
教育程度越高薪金也越高;
管理责任、教育程度、资历诸因素之间没有交互作用;
6
资历(年)、管理水平、教育程度分别对薪金的影响是线性的;
目前公司软件开发人员的薪金是合理的;
在模型改进中我们假设资历(年)、管理水平、教育程度之间存在交互作
用。
问题的分析
对于问题,在符合题意并且与实际情况较吻合的情况下,薪金记作,资历(年)记作,为了表示是否非管理人员,定义
为了表示3种教育程度,定义,
这样,中学用=1,=0来表示,大学用=0,=1表示,研究生则用=0,=0表示。
对于影响变量的这些定性因素(管理,教育),在模型求解过程中我们采用“0-1”变量来处理,并运用数学软件matlab来求解,最后对所得的解进行讨论和分析。
模型的建立及求解
符号的说明:
软件开发人员的薪金
资历
管理责任
,
教育程度
带估计的回归系数(i=1,2,3,4,5,6)
随机误差
随机误差,回归系数的样本估计值
回归系数的估计值的置信区间
残差向量
R的置信区间
回归模型的检验统计量
回归方程的决定系数
统计量值
对应的概率值
剩余方差
7


薪金与资历,管理责任,教育程度,之间的多元线性回归方程为:
模型的求解
直接利用matlab统计工具箱中的命令regress求解,使用格式为:
[b,bint,r,rint,stats]=regress(y,x,slpha)
其中输入y为模型(1)中的y的数据(n维向量,n=30),x为对应于回归系数的数据矩阵,alpha为置信区间;输出b为的估计值,bint为b的置信区间,r为残差向量,rint为r的置信区间,stats为回归模型的检验统计量,有四个值,第1个是回归方程的决定系数(是相关系数),第2个是统计量值,第3个是与统计量值对应的概率值,第4个是剩余方差。
根据上述方程式,我们用数学软件matlab对模型进行求解可以得到回归系数及其置信区间(置信水平=),检验统计量,,,的结果,见表二。
表二模型(1)的计算结果
参数
参数估计值
参数置信区间
11032
[10258,11807]
546
[484,608]
6883
[6248,7517]
-2994
[-3826,-2162]
8
148
[-636,931]
==226<=
结果分析和检验
结果分析
从表二知=,即因变量(薪金)%可由模型确定,值远远超过的检验的临界值,远小于,因而模型(1)从整体来看是可用的。比如,利用模型可以估计(或预测)一个大学毕业,有2年资历,费管理人员的薪金为:
=12272
模型中各个回归系数的含义可初步解释如下:的系数为546,说明资历增加1年薪金增长546;的系数为6883,说明管理人员薪金多6883;的系数为-2994,说明中学程度薪金比更高的少2994;的系数为148,说明大学程度薪金比更高的多148,但是注意到置信区间包含零点,说明这个系数的解释不可靠。
需要指出,以上解释是就平均值来说,并且,一个因素改变引起的因变量的变化量,都是在其他因素不变的条件下成立的。

的置信区间包含零点,说明基本模型(1)存在缺点。为了寻找改进的方向,常用残差分析方法(残差指薪金的实际值与用模型估计的薪金y1之差,是模型(1)中随机误差的估计值,这里用了一个符号)。我们将影响因素分成资历与管理-教育组合两类,管理-教育组合的定义如表三:
表三管理——教育
组合
1
2
3
4
5
6
管理
0
1
0
1
0
1
教育
1
1
2
2
3
3
9
为了对残差进行分析,图1给出了与资历的关系,图2给出与管理-教育,组合间的关系。
图1模型(1)与的关系图2模型(1)与—,组合
的关系
从图一看,残差大概分成3个水平,这是由于6种管理—教育组合混合在一起,在模型中未被正确反映的结果,、;从图2看,对于前4个管理—教育组合,残差或者全为正,或者全为负,也表明管理—教育组合在模型中处理不当。
在模型(1)中国管理责任和教育程度是分别起作用的,事实上,二者可能起着交互作用,如大学程度的管理人员的薪金会比二者分别的薪金制和高一点。
以上分析提醒我们,应在基本模型(1)中增加管理与教育,的交互项,建立新的回归模型。

通过以上分析,我们在模型一中增加管理与教育,的交互项,建立新的回归模型。模型记作:
10