编号:gswhsxxx2-3---03-02
文华高中高二数学选修 2-3
§3.1《回归分析的基本思想及其初步应用(2)》导学案
编制人:吴秀梅 审核人:戴道亮 编制时间:2014 年 12 月 20 日
学习目标:
1. 了解随机误差产生 的原因; 2. 了解判断刻画模型拟合效果的方法——相关指数和残差分析; 3. 了解建立线性回归模型的大致步骤。
重点难点:
1. 了解随机误差产生的原因,用残差平方和衡量回归方程的预报精度; 2. 了解判断刻画模型拟合效果的方法——相关指数和残差分析。
学习方法:
自主学习,合作探究
情感态度与价值观:
从实际问题中发现自己已有知识的不足之处, 激发学生的好奇心和求知欲, 培养 学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进取。
一.知识回顾
1. 相关关系是一种 关系。 2. 对具有 的两个变量进行 3. 回归直线一定过样本点的中心( )。 的方法叫回归分析。
二.新课导学(预习课本 P83~P88,完成以下相关概念)
问题 1 :由例 1 知,身高 172cm 的女大学生的体重一定是 60.316kg 吗?如果不是, 70 其原因是什么? 65 由右图,身高 172cm 的女大学生的体重不一定是 60.316kg,但一般可以认为她的体重接近于 60.316kg。 60 55 (1)随机误差的概念:当样本点散布在某一条直线的 50 附近,而不是在一条直线上时,不能用一次函数 45 y=bx+a 来描述两个变量之间的关系,而是用线性回归 40 150 155 160 165 170 175 模型______ _______来表示,这里____称为解释变量,______ 称为预报变量, _____ 称为随机误差,E(e)=_______,D(e)=__________。这样线性回归模型的完整表达式
为: ?
180
? y ? bx ? a ? e ? E (e) ? 0, D(e) ? ?
2
随机误差 e 的方差 ? 2 越小,通过回归直线 y ? bx ? a 预
?
报真实值 y 的精度越高。 问题 2 : 产生随机误差项 e 的原因是什么?
(2)残差的概念:样本值与回归值的差叫做残差,即
。
残差平方和越小,预报精确度越高,模型的拟合效果越好. (3)残差分析的概念:通过 来判断模型拟合的效果,判断原始数据中是 否存在可疑数据,这方面的分析工作称为残差分析. (4)残差图的概念:以__________为纵坐标,__________(或身高数据,或体重的估计 值等)为横坐标作出的图形,称为残差图.
?
i=1
n
? yi-^ yi?2 ,在线性回归模型中, R 2 表示解析变量对预 ? yi-- y ?2
(5)相关指数::R =1-
2
?
i=1
n
报变量变化的贡献率;R2 的值越大,说明残差平方和越小,模型的拟合效果越好.
三:合作探究
例 1:在一段时间内,某种商品的价格 x(元)和需求量 y(件)之间的一组数据为: 价格 x/元 需求量 y/件 14 12 16 10 18 7 20 5 22 3
求出 y 对 x 的回归直线方程,并说明拟 合效果的好坏
总结:建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是________,哪个变量是________. (2)画出确定好的解释变量和预报变量的______,观察它们之间的关系. (3)确定回归方程的________. (4)按一定规则估计回归方程中的________. (5)分析________是否有异常.
例2
某同学 6 次考试的数学、语文成绩在班中的排名如下表: 数学名次 x 7 6 5 3 2 语文名次 y
1
13 11 9 6 4 2 对上述数据分别用^ y=^ bx+^ a与^ y=^ cx2+^ d来拟合 y 与 x 之间的关系,并用残差分析 两者的拟合效果.
四:课堂展示
例 3:一只红铃虫的产卵数 y 和温度 x 有关,现收集了 7 组观测数据列于下表中, 试建立 y 与 x 之间的回归方程。(P86 例 2) 编号 1 2 3 4 5 6 7 温度 x/°C 21 23 25 27 29 32 35 产卵数 y/个 7 11 21 24 66 115 325 提示:建立指数函数和二次函数模型,并比较两个模型的拟合效果.
五.课堂小结
n n - ^ 1.总偏差平方和: ? ( yi- y )2; 残差平方和: ? ( yi-yi)2; i=1 i=1
回归平方和: ? ( yi-- y )2- ? ( yi-^ yi)2;
i=1 i=1
n
n
2.判断刻画模型拟合效果的方法: (1)残差平方和越小,预报精确度越高. (2)相关指数 R 取得越大,说明模型的拟合效果越好
2
本节课我最大的收获是: 我存在的疑惑有:
. .
文华高中高二数学选修 2-3
《回归分析的基本思想及其初步应用》节节过关达标检测
班级:-----------1. 有下列说法:
组名:------------
学生姓名:----------
①在残差图中,残差点比较均匀地落在水平的带状区域内,说明选用的模型比较合 适; ②用相关指数 R2 来刻画回归的效果,R2 值越大,说明模型的拟合效果越好; ③比较两个模型的拟合效果, 可以比较残差平方和的大小, 残差平方和越小的模型, 拟合效果越好. 其中正确命题的个数是( A.0 个 B.1 个 ) C.2 个 D.3 个
2. 分别用指数函数模型和二次函数模型来拟合两个变量,残差平方和分别为 1 450.673 和 15 448.432,故选用______模型的拟合效果远远优于_________模型。 3. 若对于变量 y 与 x 的 10 组统计数据的回归模型中,R2=0.95,又知残差平方和
10 为 120.53,那么 ? (yi-- y )2 的值为______________。 i=1
4. 若一组观测值(x1,y1)、(x2,y2)、…、(xn,yn)之间满足 yi=bxi+a+ei (i= 1,2,…,
n),若 ei 恒为 0,则 R2 为_______。
5. 关于 x 与 y 有如下数据:
x y
2 30
4 40
5 60
6 50
8 70
有如下的两个线性模型:①^ y=6.5x+17.5;②^ y=7x+1。 试比较哪一个模型拟合效果更好。