高中數學 第三章 統(tǒng)計案例 1 回歸分析(課時1)課件 新人教B版選修2-3.ppt
《高中數學 第三章 統(tǒng)計案例 1 回歸分析(課時1)課件 新人教B版選修2-3.ppt》由會員分享,可在線閱讀,更多相關《高中數學 第三章 統(tǒng)計案例 1 回歸分析(課時1)課件 新人教B版選修2-3.ppt(26頁珍藏版)》請在裝配圖網上搜索。
3.1回歸分析的基本思想及其初步應用(第一課時),1.通過典型案例的探究,進一步了解回歸分析的基本思想、方法及其初步應用.2.讓學生經歷數據處理的過程,培養(yǎng)他們對數據的直觀感覺,體會統(tǒng)計方法的特點,認識統(tǒng)計方法的應用,通過使用轉化后的數據,求相關指數,運用相關指數進行數據分析、處理的方法.3.從實際問題中發(fā)現已有知識的不足,激發(fā)好奇心,求知欲,通過尋求有效的數據處理方法,開拓學生的思路,培養(yǎng)學生的探索精神和轉化能力,通過案例的分析使學生了解回歸分析在實際生活中的應用,增強數學取之生活,用于生活的意識,提高學習興趣.,本節(jié)課通過必修3熟悉有例題回顧線性相關關系知識,通過實際問題中發(fā)現已有知識的不足,引出隨機誤差、殘差、殘差分析的概念,進而運用殘差來進行數據分析,通過例題講解掌握用殘差分析判斷線性回歸模型的擬合效果。掌握建立回歸模型的步驟。本節(jié)內容學生內容不易掌握,通過知識整理與比較引導學生進行區(qū)分、理解。通過對典型案例的探究,練習進行鞏固了解回歸分析的基本思想方法和初步應用.,從某大學中隨機選取8名女大學生,其身高和體重數據如下表所示:怎樣根據一名女大學生的身高預報她的體重,并預報一名身高為172cm的女大學生的體重?,根據必修32.3變量相關關系解決這個問題的方法:1.先判斷是兩個變量是否具有線性相關關系(1)作散點圖,如圖所示(見課本P82:圖3.1-1),2.根據線性回歸的系數公式,求回歸直線方程=0.849x-85.712,3.由線性回歸方程可以估計其位置值為=60.316(千克)左右。,具有較好的線性相關關系,性質:回歸直線一定過樣本中心點.,(2)計算相關系數,,這些點并不都在同一條直線上,上述直線并不能精確地反映x與y之間的關系,y的值不能完全由x確定,它們之間是統(tǒng)計相關關系,y的實際值與估計值之間存在著誤差.,因此,在統(tǒng)計學中設它們的線性回歸模型為:,其中a,b為模型的未知參數,e為y與bx+a之間的誤差,稱它為隨機誤差,它是隨機變量。且,線性回歸模型完整表達式為,x稱為變量,y稱為變量.,解釋,預報,線性回歸模型中隨機誤差的主要來源:①線性回歸模型中的預報值與真實情況y引起的誤差;②觀測與計算(用代替ba)產生的誤差;③省略了一些因素的影響(如生活習慣等)產生的誤差.,在線性回歸模型中,e為用bx+a的預報真實值y的隨機誤差,它是一個不可觀測的量,那么應該怎樣研究隨機誤差?,稱相應于點的殘差,坐標縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點應該分布在以橫軸為中心的帶形區(qū)域;對于遠離橫軸的點,要特別注意。,身高與體重殘差圖,殘差的作用,1.通過殘差表或殘差圖發(fā)現原始數據中的可疑數據,通過殘差來判斷模型擬合的效果這種分析工作稱為殘差分析.,通過殘差表或殘差圖判斷模型擬合的效果是直觀判斷,如何精確判斷模型擬合的效果?,引入參數R2,來精確該畫模型擬合效果,對于己獲取的樣本數據,在上式子中是定值,越小,即殘差平方和越小,R2越大,說明模型擬合效果越好。,引入例中參數R2計算得約為0.64說明女大學生體重差異有百分之六十四是由身高引起的.,知識點線性回歸分析1.對線性回歸模型的三點說明(1)非確定性關系:線性回歸模型y=bx+a+e與確定性函數y=bx+a相比,它表示y與x之間是統(tǒng)計相關關系(非確定性關系),其中的隨機誤差e提供了選擇模型的準則以及在模型合理的情況下探求最佳估計值a,b的工具.,(2)線性回歸方程中,的意義是:以為基數,x每增加1個單位,y相應地平均增加個單位.(3)線性回歸模型中隨機誤差的主要來源①線性回歸模型與真實情況引起的誤差;②觀測與計算產生的誤差;③省略了一些因素的影響產生的誤差.,2.線性回歸模型的模擬效果(1)殘差圖法:觀察殘差圖,如果殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高.,(2)殘差的平方和法:一般情況下,比較兩個模型的殘差比較困難(某些樣本點上一個模型的殘差的絕對值比另一個模型的小,而另一些樣本點的情況則相反),故通過比較兩個模型的殘差的平方和的大小來判斷模型的擬合效果.殘差平方和越小的模型,擬合的效果越好.(3)R2法:R2的值越大,說明殘差平方和越小,也就是說模型擬合的效果越好.,3.相關系數與R2(1)R2是相關系數的平方,其變化范圍為[0,1],而相關系數的變化范圍為[-1,1].(2)相關系數可較好地反映變量的相關性及正相關或負相關,而R2反映了回歸模型擬合數據的效果.(3)當|r|接近于1時說明兩變量的相關性較強,當|r|接近于0時說明兩變量的相關性較弱,而當R2接近于1時,說明線性回歸方程的擬合效果較好.,【微思考】(1)殘差與我們平時說的誤差是一回事兒嗎?提示:這兩個概念在某程度上具有很大的相似性,都是衡量不確定性的指標,二者的區(qū)別是:誤差與測量有關,誤差可以衡量測量的準確性,誤差越大表示測量越不準確;殘差與預測有關,殘差大小可以衡量預測的準確性,殘差越大表示預測越不準確.,(2)R2與原來學過的相關系數r有區(qū)別嗎?提示:它們都是刻畫兩個變量之間的的相關關系的,區(qū)別是R2表示解釋變量對預報變量變化的貢獻率,其表達式為R2=1-;相關系數r是檢驗兩個變量相關性的強弱程度,其表達式為,建立回歸模型的基本步驟(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量.(2)畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系(如是否存在線性關系等).(3)由經驗確定回歸方程的類型(如我們觀察到數據呈線性關系,則選用線性回歸方程).(4)按一定規(guī)則(如最小二乘法)估計回歸方程中的參數.(5)得出結果后分析殘差圖是否有異常(如個別數據對應殘差過大,或殘差呈現不隨機的規(guī)律性等).若存在異常,則檢查數據是否有誤,或模型是否合適等.,為研究重量x(單位:克)對彈簧長度y(單位:厘米)的影響,對不同重量的6個物體進行測量,數據如下表所示:,(1)作出散點圖并求線性回歸方程;(2)求出R2;(3)進行殘差分析.,作殘差分析時,一般從以下幾個方面予以說明:(1)散點圖;(2)相關指數;(3)殘差圖中的異常點和樣本點的帶狀分布區(qū)域的寬窄.,解答(1)散點圖如圖,(3)由殘差表中的數值可以看出第3個樣本點的殘差比較大,需要確認在采集這個數據的時候是否有人為的錯誤,如果有的話,需要糾正數據,重新建立回歸模型;由表中數據可以看出殘差點比較均勻地落在不超過0.15的狹窄的水平帶狀區(qū)域中,說明選用的線性回歸模型的精度較高,由以上分析可知,彈簧長度與拉力成線性關系.規(guī)律方法當資料點較少時,也可以利用殘差表進行殘差分析,注意計算數據要認真細心,殘差分析要全面.,1.判一判(正確的打“√”,錯誤的打“”)(1)殘差平方和越小,線性回歸方程擬合效果越好.()(2)在畫兩個變量的散點圖時,預報變量在x軸上,解釋變量在y軸上.()(3)R2越接近于1,線性回歸方程的擬合效果越好.(),√,,√,2.做一做(請把正確的答案寫在橫線上)(1)從散點圖上看,點散布在從左下角到右上角的區(qū)域內,兩個變量的這種相關關系為.(2)在殘差分析中,殘差圖的縱坐標為.(3)如果發(fā)現散點圖中所有的樣本點都在一條直線上,則殘差平方和等于,解釋變量和預報變量之間的相關系數R等于.,正相關,殘差,0,1或-1,3.已知某種商品的價格x(元)與需求量y(件)之間的關系有如下一組數據:,求y對x的回歸直線方程,并說明回歸模型擬合效果的好壞.,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 高中數學 第三章 統(tǒng)計案例 回歸分析課時1課件 新人教B版選修2-3 第三 統(tǒng)計 案例 回歸 分析 課時 課件 新人 選修
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://m.hcyjhs8.com/p-3178918.html