《《標準偏差計算》PPT課件》由會員分享,可在線閱讀,更多相關《《標準偏差計算》PPT課件(50頁珍藏版)》請在裝配圖網上搜索。
1、 平均數是統計學中最常用的統計量,用來表明資料中各觀測值相對集中較多的中心位置。平均數主要包括有: 算術平均數(arithmetic mean) 中位數(median) 眾數(mode) 幾何平均數(geometric mean) 調和平均數(harmonic mean) 一、算術平均數 算術平均數是指資料中各觀測值的總和除以觀測值個數所得的商,簡稱平均數或均數,記為。 算術平均數可根據樣本大小及分組情況而采用直接法或加權法計算。 (一)直接法 主要用于樣本含量n30以下、未經分組資料平均數的計算。 設某一資料包含n個觀測值: x1、x2、xn, 則樣本平均數可通過下式計算: 其中,為總和符號
2、; 表示從第一個觀測值x 1累加到第n個觀測值xn。當 在意義上已明確時,可簡寫為x,(3-1)式可改寫為: nxn xxxx ni in 121 ni ix1nxx 【例3.1】 某種公牛站測得10頭成年公牛的體重分別為500、520、535、560、585、600、480、510、505、490(kg),求其平均數。 由于 x=500+520+535+560+58 +600+480+510+505+49 =5285, n=10 得: 即10頭種公牛平均體重為528.5 kg。 (二)加權法 對于樣本含量 n30 以上且已分組的資料,可以在次數分布表的基礎上采用加權法計算平均數,計算公式為:
3、 .5(kg)528105285 nxx ffxfxffff xfxfxfx ki iki iik kk 1121 2211 式中: 第i組的組中值; 第i組的次數; 分組數 第i組的次數fi是權衡第i組組中值xi在資料中所占比重大小的數量,因此將fi 稱為是xi的“權”,加權法也由此而得名。 【例3.2】 將100頭長白母豬的仔豬一月窩重(單位:kg)資料整理成次數分布表如下,求其加權數平均數。ixifk 表31 100頭長白母豬仔豬一月窩重次數分布表 利用(32)式得: 即這100頭長白母豬仔豬一月齡平均窩重為45.2kg。 計算若干個來自同一總體的樣本平均數的平均數時,如果樣本含量不等,
4、也應采用加權法計算。 )(2.451004520 kgffxx 【例3.3】 某牛群有黑白花奶牛 1500頭,其平均體重為750 kg ,而另一牛群有黑白花奶牛1200頭,平均體重為725 kg,如果將這兩個牛群混合在一起,其混合后平均體重為多少? 此例兩個牛群所包含的牛的頭數不等,要計算兩個牛群混合后的平均體重,應以兩個牛群牛的頭數為權,求兩個牛群平均體重的加權平均數,即 即兩個牛群混合后平均體重為738.89 kg。 (三)平均數的基本性質 1、樣本各觀測值與平均數之差的和為零,即離均差之和等于零。 或簡寫成)(89.7382700 12007251500750 kgffxx 0)( 1
5、xxni i 0)( xx 2、樣本各觀測值與平均數之差的平方和為最小,即離均差平方和為最小。 (xi- )2 (xi- a)2 (常數a ) 或簡寫為: 幾何平均數調和平均數 上述五種平均數,最常用的是算術平均數。 一、標準差的意義 用平均數作為樣本的代表,其代表性的強弱受樣本資料中各觀測值變異程度的影響。僅用平均數對一個資料的特征作統計描述是不全面的,還需引入一個表示資料中觀測值變異程度大小的統計量。 全距(極差)是表示資料中各觀測值變異程度大小最簡便的統計量。但是全距只利用了資料中的最大值和最小值,并不能準確表達資料中各觀測值的變異程度,比較粗略。當資料很多而又要迅速對資料的變異程度作出
6、判斷時,可以利用全距這個統計量。 為 了 準 確 地 表示樣本內各個觀測值的變異程度 ,人們 首 先會考慮到以平均數為標準,求出各個觀測值與平均數的離差,( ) ,稱為離均差。 雖然離均差能表示一個觀測值偏離平均數的性質和程度,但因為離均差有正、有負 ,離均差之和 為零,即( ) = 0 ,因 而 不 能 用離均差之和( )來 表 示 資料中所有觀測值的總偏離程度。 xx xx xx 為了解決離均差有正 、有負,離均差之和為零的問 題 , 可先求 離 均 差的絕 對 值 并 將 各 離 均 差 絕對 值 之 和 除以 觀 測 值 個 數 n 求 得 平 均 絕 對 離差,即| |/n。雖然平均
7、絕對離差可以表示資料中各觀測值的變異程度 ,但由于平均絕對離差包含絕對值符號 ,使用很不方便,在統計學中未被采用。xx 我們還可以采用將離均差平方的辦法來解決離均差有正、有負,離均差之和為零的問題。 先將各 個離 均差平方,即 ( )2 ,再求 離均差平方和 , 即 ,簡稱平方和,記為SS; 由 于 離差平方和 常 隨 樣 本 大 小 而 改 變 ,為 了 消 除 樣 本大小 的 影 響 , 用平方和 除 以 樣 本 大 小, 即 ,求出離均差平方和的平均數 ;xx2)( xx nxx /)( 2 為了使所得的統計量是相應總體參數的無 偏估計量,統計學證明,在求離均差平方和的平均數時,分母不用
8、樣本含量n,而用自由度 n-1, 于是,我們 采 用統計量 表示資料的變異程度。 統計量 稱 為 均 方 ( mean square縮寫為MS),又稱樣本方差,記為S 2,即 S2= 1/)( 2 nxx 1/)( 2 nxx 1/)( 2 nxx 相應的總體參數叫 總體方差 ,記為2。對于有限總體而言,2的計算公式為: Nxx /)( 22 由于 樣本方差 帶有原觀測單位的 平方單位,在僅表示一個資料中各觀測值的變異程度而不作其它分析時 , 常需要與平均數配合使用 ,這 時應 將平方單位還原,即應求出樣本方差的平方根。統計學上把樣本方差 S2 的平方根叫做樣本標準 差,記為S,即: 1 )(
9、 2 n xxS 由于 所以上式可改寫為: )2()( 222 xxxxxx 22 2 xnxxx 222 )()(2 nxnnxx nxx 2 2 )( 1 2)(2 nxS nx 相應的總體參數叫總體標準差,記為。對于有限總體而言,的計算公式為: 在統計學中,常用樣本標準差S估計總體標準差。 Nx /)( 2 二、標準差的計算方法 (一)直接法 對于未分組或小樣本資料 , 可直接利用(311)或(3-12)式來計算標準差。 【例3.9】 計算10只遼寧絨山羊產絨量: 450, 450, 500, 500, 500,550, 550, 550, 600, 600,650(g)的標準差。 此例
10、n=10,經計算得:x=5400,x2=2955000,代入(312)式得: 即10只遼寧絨山羊產絨量的 標準差 為65.828g。828.65110 10/540029550001 /)( 222 n nxxS (二)加權法 對于已制成次數分布表的大樣本資料,可利用次數分布表,采用加權法計算標準差。計算公式為: 式中,f為各組次數;x為各組的組中值;f = n為總次數。 1 /)(1)( 222 f ffxfxf xxfS 【例3.10】 利用某純系蛋雞200枚蛋重資料的次數分布表(見表3-4)計算標準差。 將表3-4中的f、fx、 代入(314)式得: 即某 純 系 蛋 雞200枚 蛋 重
11、的標準差為3.5524g。5524.31200 200/1.1070511.5755071 /)( 222 f ffxfxS 2fx 表34 某純系蛋雞200枚蛋重資料次數分布 及標準差計算表 三、標準差的特性 (一)標準差的大小,受資料中每個觀測值的影響,如觀測值間變異大,求得的標準差也大,反之則小。 (二)在計算標準差時,在各觀測值加上或減去一個常數,其數值不變。 (三)當每個觀測值乘以或除以一個常數a,則所得的標準差是原來標準差的a倍或1/a倍。 (四)在資料服從正態(tài)分布的條件下,資料中約有68.26%的觀測值在平均數左右一倍標準差( S)范圍內;約有95.43%的觀測值在平均數左右兩倍
12、標準差( 2S)范圍內;約有99.73%的觀測值在平均數左右三倍標準差( 3S) 范 圍內。也就是說全距近似地等于6倍標準差,可用(全距/6)來粗略估計標準差。 x xx 變異系數是衡量資料中各觀測值變異 程度的另一個統計量 。 標 準差與平均數的比值稱為 變異系數,記為CV。 變異系數可以消除單位 和 (或)平 均數不同對兩個或多個資料變異程度比較的影響。 變異系數的計算公式為: 【例3.11】 已知某良種豬場長白成年母豬平均體重為 190kg, 標準差為10.5kg,而大約克成年母豬平均體重為196kg,標準差為8.5kg,試問兩個品種的成年母豬,那一個體重變異程度大。 %100 xSVC 由于,長白成年母豬體重的變異系數: 大約克成年母豬體重的變異系數: 所以,長白成年母豬體重的變異程度大于大約克成年母豬。 %53.5%1001905.10 VC %34.4%1001965.8 VC 注意,變異系數的大小,同時受平均數和標準差兩個統計量的影響,因而在利用變異系數表示資料的變異程度時,最好將平均數和標準差也列出。