单位文秘网 2021-07-17 14:28:44 点击: 次
摘 要:实验教学已成为现代概率论与数理统计教学的重要环节,在开设概率模型、数据统计、区间估计与假设检验、回归分析与方差分析等基本实验的基础上,用数学建模实施综合实验,有利于学生系统掌握概率统计理论知识并提高动手解决综合性实际问题的能力。
关键词:概率论与数理统计数学实验数学建模
中图分类号:O21文献标识码:A文章编号:1673-9795(2011)08(a)-0039-02
以培养学生应用概率统计方法解决实际问题能力为目的的实验教学正在逐步成为概率论与数理统计教学的重要环节。数学建模通过分析问题、建立初始模型、输入观测数据求解模型、根据运行结果解释模型并判断解释的可靠性、进一步优化模型并求解等,直到求解出“最优”的模型。通过这一系列过程,学生可以将所学理论得到实现,提高了实际动手解决问题的能力,反过来,也加深了所学理论知识的理解,并有所拓展。全国大学生数学建模竞赛的许多问题都不同程度地涉及概率和统计知识,例如:AIDS的疗效预测与评价、电力市场的输电阻塞管理、北京奥运会人流分布、医院病床的合理安排等。由此可见,将数学建模思想与方法渗透到概率论与数理统计实验教学就非常必要(这也是教育部倡导的一种新方法、新思路)。下面通过实例说明数学建模在概率论与数理统计实验教学中的作用。
问题:根据某企业软件开发人员的薪金数据,建立模型研究薪金与资历、管理责任、教育程度的关系,分析人事策略的合理性,作为新聘用人员薪金的参考。
分析与假设:用y表示薪金;资历x1为从事专业工作的年数;管理责任x2分为:1=管理人员、0=非管理人员;教育程度(中学1、大学2、更高3)用x3和x4表示:x3=1(中学)、x3=0(其它);x4=1(大学)、x4=0(其它);因此,中学为x3=1且x4=0;大学为x3=0且x4=1;更高为x3=0且x4=0。
首先,假设资历每增加一年薪金的增长是常数;管理、教育、资历之间无交互作用,则可建立线性回归模型:
,其中a0, a1, …, a4是待估计的回归系数,e是随机误差。
用Matlab求解如下:
y=[;;…]; %开发人员薪金数据组成的n维向量。
I=ones(n,1);% I是元素全为1的n维向量。
=[;;…];%从事专业工作年限数据组成的n维向量。
=[;;…];%管理责任数据组成的n维向量。
=[;;…];%是否是中学数据组成的n维向量。
=[;;…];%是否是大学数据组成的n维向量。
x=[I];%x是n5维数据矩阵。
alpha=0.05;%置信水平为0.05。
[b,bint,r,rint,stats]=regress(y,x,alpha) %模型求解。
根据以上格式输入一组原始数据后运行得到如下结果:
b=(11032,546,6883,-2994,148)’,即得到回归模型:
stats=(0.9570,226.0000,0.0002)’,即模型整体上可用。
Bint返回的5个置信区间分别为:(10258,11807);(484,608);(6248,7517);(-3826,-2162);(-636,931)。我们发现最后一个置信区间包含零点,表明自变量对因变量y的回归效果不显著,可考虑对模型进一步优化。
rcoplot(r,rint);%输出残差图。
进一步,将管理-教育组合分成以下6种情况(表1)。
分析残差与资历、残差与管理-教育组合之间的关系,得到其残差图(见图1),可以看出残差大致分成三个水平,全为正或全为负,表明管理-教育组合处理不当,应在模型中增加管理与教育、的交叉项。
其次,增加管理与教育、的交叉项,建立进一步的模型。
按照上述方法求得回归模型为
stats=(0.9990,554.0000,0.0000)’
相应的7个置信区间分别为:(11044,11363);(486,508);(6841,7255);(-1939,-1514);(-545,152);(-3372,-2769);(1571,2101)。
可以看出,R2和F都有所改进,且置信区间都不包含零点,因此模型完全可用。
进一步分析残差与管理-教育组合的关系(见图2右),残差基本上集中分布在零点附近,除了一个异常数据(33号)。
然后,考虑去掉异常数据后进行回归,得到回归模型:
stats=(0.9998, 36701.0000,0.0000)’
相应的7个置信区间分别为:(11139,11261);(494,503);(6962,7120);(-1818,-1656);(-431,281);(-3171,-2942);(1894,2100)。
可以看出,R2的变化:226→554→36701,F由0.957→0.999→0.9998,置信区间长度更短,都有所改进,且置信区间都不包含零点,残差图(图3)也十分正常,模型得到大大改进,可以进行最终应用。
该模型的建立是一个综合运用概率统计知识解决实际问题的过程,它涉及一元线性回归、多元线性回归、非线性回归、区间估计、假设检验、残差分析、预报与控制等知识点,涉及相关理论在数学软件中的实现,包括数据输入输出、数据处理、作图等技巧。例如,在教材中某个自变量(如)对因变量的影响是否显著,需要检验是否成立,但在Matlab求解时,只需看其置信区间是否包含零点即可。
参考文献
[1] 徐西祥,路荣武.概率论与数理统计中的几个数学实验[J].科技信息,2010,36:487~488.
[2] 郝晓斌,董西广.数学建模思想在概率论与数理统计课程教学中的应用[J].经济研究导刊,2010,16:244~245.
(责任编辑:单位文秘网) )地址:https://www.kgf8887.com/show-136-65371-1.html
下一篇:“概率论与数理统计”教学浅探
版权声明:
本站由单位文秘网原创策划制作,欢迎订阅或转载,但请注明出处。违者必究。单位文秘网独家运营 版权所有 未经许可不得转载使用