《1.1回歸分析的基本思想及其初步應用第2課時.教案》由會員分享,可在線閱讀,更多相關《1.1回歸分析的基本思想及其初步應用第2課時.教案(7頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、
1.1回歸分析的基本思想及其初步應用第2課時.教案
1.1 回歸分析的基本思想及其初步(二)
【學情分析】:
教學對象是高二文科學生,學生已掌握建立線性回歸模型的知識,并能用所學知識解決一些簡單的實際問題。在教學中,要結(jié)合實例讓學生了解評價回歸效果的三個統(tǒng)計量:總偏差平方和、殘差平方和、回歸平方和。初步了解可以通過求回歸模型的相關指數(shù)或利用殘差分析不同的回歸模型的擬合精確度。在起點低的班級中注重讓學生參與實踐,鼓勵學生通過收集數(shù)據(jù),經(jīng)歷數(shù)據(jù)處理的過程,從而進一步體會回歸分析中的數(shù)理計算,初步形成運用統(tǒng)計方法解決實際問題的基本思想,認識統(tǒng)計方法在決策中的作用。讓學生直觀的觀察、思考,
2、借助于線性回歸模型研究呈非線性關系的兩個變量之間的關系。
【教學目標】:
(1)知識與技能:
了解評價回歸效果的三個統(tǒng)計量:總偏差平方和、殘差平方和、回歸平方和;了解偏差平方和分解的思想;了解判斷刻畫模型擬合效果的方法——相關指數(shù)和殘差分析;了解非線性模型通過變換轉(zhuǎn)化為線性回歸模型。
(2)過程與方法:
本節(jié)內(nèi)容先從大學中女大學生的甚高和體重之間的關系入手,求出相應的回歸直線方程,從中也找出存在的不足,從而有進行回歸分析的必要性,進而學習相關指數(shù),用相關指數(shù)來刻畫回歸的效果。
(3)情感態(tài)度與價值觀:
從實際問題中發(fā)現(xiàn)自己已有知識的不足之處,激發(fā)學生的好奇心和求知欲,培養(yǎng)學生不滿
3、足于已有知識,勇于求知的良好個性品質(zhì),引導學生積極進取。
【教學重點】:
1、了解判斷刻畫模型擬合效果的方法——相關指數(shù)和殘差分析;
2、通過探究使學生體會有些非線性模型通過變換可以轉(zhuǎn)化為線性回歸模型。
【教學難點】:
1、 解釋殘差變量的含義;
2、了解偏差平方和分解的思想。
【課前準備】:
課件
【教學過程設計】:
教學環(huán)節(jié)
教學活動
設計意圖
一、創(chuàng)設情境
1.由例1知,預報變量(體重)的值受解釋變量(身高)或隨機誤差的影響。
2.問題一:為了刻畫預報變量(體重)的變化在多大程度上與解釋變量(身高)有關?在多大程度上與隨機誤差有關?
我們引入了評價回
4、歸效果的三個統(tǒng)計量:總偏差平方和、殘差平方和、回歸平方和。
引入回歸分析的效果評價的三個統(tǒng)計量
二、探究新知
⑴總偏差平方和:每個效應(觀測值減去總的平均值)的平方加起來,即用表示總的效應;
學生動手計算出例1中的總偏差平方和。
⑵殘差平方和:數(shù)據(jù)點和它在回歸直線上相應的位置的差異是隨機誤差的效應,稱為殘差,為殘差平方和;
學生動手計算出例1中的殘差(如下表)與殘差平方和。
編號
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
體重/kg
48
57
50
54
64
61
5、
43
59
yi
54.373
54.373
47.581
58.618
62.863
54.373
45.883
58.618
ei
-6.373
2.627
2.419
-4.618
1.137
6.627
-2.883
0.382
⑶回歸平方和:解釋變量和隨機誤差的總效應(總偏差平方和),即總的偏差平方和=回歸平方和+殘差平方和,所以
回歸平方和=總的偏差平方和-殘差平方和
學生動手計算出例1中的回歸平方和。
學習要領:①注意、、的區(qū)別;
②預報變量的變化程度可以分解為由解釋變量引起的變化程度與殘差變量的變化程度之和;
③
6、當總偏差平方和相對固定時,殘差平方和越小,則回歸平方和越大,此時模型的擬合效果越好;
④對于多個不同的模型,我們還可以引入相關指數(shù)來刻畫回歸的效果,它表示解釋變量對預報變量變化的貢獻率. 的值越接近于1,說明殘差平方和越小,也就是說模型擬合的效果越好,即解釋變量和預報變量的線相關性越強.
代入例1中的數(shù)據(jù)知例1中的,即解釋變量對總效應約貢獻了64%,而隨機誤差貢獻了剩余的36%,所以身高對體重的效應比隨機誤差的效應大得多。
問題二:觀察圖1.1-5中的殘差圖,樣本點是如何分布?有無異常情況(個別數(shù)據(jù)對應殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性等等)?
師:提出問題,指導學生畫出殘差圖(以
7、殘差為縱坐標,樣本編號或身高或體重為橫坐標作出圖形),引導學生進行殘差分析,從而做到檢查數(shù)據(jù)是否有誤,或模型是否合適等。
生:分析、討論。
從殘差圖中可以看到第1個樣本點和第6個樣本點的殘差較大,需要確認是否出現(xiàn)采集的錯誤,指導學生去掉這兩個數(shù)據(jù)后重新再計算回歸方程與相關指數(shù),了解到擬合的效果會更好。
引導學生歸納殘差所能說明的情況:
① 樣本點的殘差比較大,確認采集數(shù)據(jù)時是否出現(xiàn)人為的錯誤或其他原因;
② 殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,帶狀區(qū)域的寬度越窄,模型擬合精度越高,回歸方程的預報精度越高。
結(jié)合實例由結(jié)果分析殘差圖是否異常,養(yǎng)成從實際問
8、題出發(fā),抽象為數(shù)學問題中的線性回歸問題,從而指導實際問題的解決。
引導學生利用殘差也可以分析所求出的模型的擬合效果
通過學生動手計算感受相關指數(shù)與殘差分析說明回歸方程的預報情況。
三、例題選講
例2:一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關,現(xiàn)收集了7組觀測數(shù)據(jù)列于下表中,試建立y與x之間的回歸方程。
編號
1
2
3
4
5
6
7
溫度x/C
21
9、
23
25
27
29
32
35
產(chǎn)卵數(shù)y/個
7
11
21
24
66
115
325
問題三:例2中如何選擇解釋變量與預報變量?
師:讀例2的要求,引導學生理解例題含義。
生:思考、討論、敘述自己的理解。
形成把溫度x作自變量,紅鈴蟲的產(chǎn)卵數(shù)y作因變量的共識
問題四:觀察圖1.1-6中的散點圖,紅鈴蟲的產(chǎn)卵數(shù)y與溫度x具有線性關系嗎?除線性關系外,還學過哪些常見的函數(shù)關系?
師:繪制散點圖1.1-6,引導學生觀察散點圖的特點:隨著自變量的增加,因變量也隨之增加。
引導學生探究紅鈴蟲的產(chǎn)卵數(shù)y與溫度x更可能是什么關系,選擇幾個模型,比如線性回
10、歸模型、二次函數(shù)模型、指數(shù)函數(shù)模型。而二次與指數(shù)函數(shù)模型是屬于非線性回歸模型。
生:討論、回憶一些常見函數(shù)圖象的特點,判斷紅鈴蟲的產(chǎn)卵數(shù)y與溫度x的可能關系
從散點圖中可以看到樣本點分布在指數(shù)函數(shù)曲線的周圍。
問題五:請學生思考能否把模型經(jīng)過變換后轉(zhuǎn)化為另外兩個變量的線性關系?
師:提出問題,引導學生尋找變換的方法,在學生討論后給出具體的方法。
生:思考、討論、解釋。
解答過程如下:
對兩邊取自然對數(shù)
令,建立與之間的線性回歸方程
問題六:經(jīng)過變換后指數(shù)函數(shù)模型轉(zhuǎn)化為線性回歸模型,你如何得到這個線性回歸模型的參數(shù)估計?
師:提出問題,引導學生分組討論,啟發(fā)學
11、生把原變量的觀測數(shù)據(jù)轉(zhuǎn)化為新變量的數(shù)據(jù),然后讓學生給出每種線性回歸模型的參數(shù)估計。
生:以組為單位進行數(shù)據(jù)變換,求參數(shù)的最小二乘估計(可以用計算器)
解答過程如下:
令,,即
分析與之間的關系,通過畫散點圖(如下圖),可知與之間是存在著線性回歸關系,可以用最小二乘法求出線性回歸方程
列表計算出各個量
編號
1
2
3
4
5
6
7
合計
溫度x/C
21
23
25
27
29
32
35
192
產(chǎn)卵數(shù)y/個
7
11
21
24
66
115
325
569
z=ln y
1.946
2.398
3.04
12、5
3.178
4.190
4.745
5.784
25.285
xi2
441
529
625
729
841
1024
1225
5414
xizi
40.9
55.2
76.1
85.8
121.5
151.8
202.4
733.7
27.429 3.612
5414 733.71
問題七:我們的目標是建立紅鈴蟲的產(chǎn)卵數(shù)y與溫度x的模型,如何使得到的線性回歸模型再變回紅鈴蟲的產(chǎn)卵數(shù)
13、y與溫度x的模型?
師:提出問題。
生:進行變換,每組得到紅鈴蟲的產(chǎn)卵數(shù)y與溫度x的模型。
因為,所以,即。
引導學生分析哪個變量作自變量,哪個變量作因變量
引導學生根據(jù)散點圖判斷兩個變量的關系,使學生了解不是任何兩個變量都一定是線性關系。
使學生進一步體會把因變量與自變量的非線性關系經(jīng)過變換后轉(zhuǎn)化為另外兩個變量的線性關系的方法。
使學生熟悉線性回歸模型的參數(shù)估計的方法
14、
得出紅鈴蟲的產(chǎn)卵數(shù)y與溫度x的模型
四、練習
1. 試對下列非線性模型進行適當?shù)淖冃危怪€性化
⑴; ⑵
解:⑴對兩邊取自然對數(shù),即
令,則有
⑵令,則有
鞏固知識
五、小結(jié)
1. 分清總偏差平方和、殘差平方和、回歸平方和,初步了解如何評價模型擬合效果的好壞;
2. 注意回歸方程適用的范圍、時間。
3. 歸納非線性回歸模型的求解步驟:
⑴畫出兩個變量的散點圖;
⑵判斷是否線性相關;
⑶非線性相關模型要進行變換,轉(zhuǎn)為線性回歸模型;
⑷求出回歸模型的方程(利用最小二乘法)。
15、練習與測試
1. 下面4 個散點圖中,不適合用線性回歸模型擬合其中兩個變量的是( A )
A. B.
C. D.
2. 將非線性模型進行適當變形使之線性化。
答案:
3. 已知回歸方程,則樣本點P(4,2.71)的殘差為________________。
答案:
4. 已知線性相關的兩變量,的三個樣本點A(0,0),B(1,3),C(4,11),若用直線AB作為其預測模型,則點C 的殘差是________。
答案:,,。
5. 若一組觀測值(x1,y
16、1)、(x2,y2)、…、(xn,yn)之間滿足yi=bxi+a+ei (i=1、2. …n)若ei恒為0,則R2為
答案:1
6. 已知線性相關的兩變量,的三個樣本點A(0,0),B(1,3),C(4,11),若用直線AB作為其預測模型,則其相關指數(shù)________。
答案:,,,,
,,
,,
7. 現(xiàn)有一個由身高預測體重的回歸方程:體重預測值=4(磅/英寸)身高-130(磅)。其中體重和身高分別以磅和英寸為單位,已知1英寸≈2.5 cm,1磅≈0.45 kg,則該回歸方程應該是______________。
答案:體重預測值=0.72(kg/ cm)身高-58.5(kg)