華東師大心理統計筆記
查看(1175) 回復(0) |
|
smallbs
|
發表于 2010-08-23 18:20
樓主
華東師大心理統計筆記
第一章 緒論 &1.隨機現象與統計學 確定現象 隨機現象 本人性別 生男生女 光的速度 學習成績 種豆得豆 (人的)反應速度 隨機現象:具有以下三個特性的現象稱為隨機現象 (i) 一次試驗有多種可能結果,其所有可能結果是已知的。 (ii) 試驗之前不能預料哪一種結果會出現 (iii) 在相同條件下可以重復試驗 隨機事件:隨機現象的每一種結果叫做一個隨機事件。 隨機變量:把能表示隨機現象各種結果的變量稱為隨機變量 統計學的研究對象是隨機現象規律性隨機變量的分布: (i)正態分布 eg:學習成績 圖(略) (ii)雙峰分布 eg::汽車擁擠程度 圖(略) (iii)另一種分布 eg:如下 圖(略) &2.總體和樣本 總體:是我們所研究的具有某種共同特性的個體的總和 樣本:是從總體中抽取的作為觀察對象的一部分個體。 (i) 總體:有限總體:總體所包含的個體數目有限時 無限總體:總體所包含的個體數目無限時 →參數:總體上的各種數字特征 (ii) 總體→抽樣→ 樣本:大樣本:>30 >50 小樣本:≤30 ≤50(更精神) (樣本容量:樣本中包含的個體數目) →統計量:樣本上的數字特征 根據統計量來估計參數 &3.心理統計學的內容 1. 描述統計: 對已獲得的數據進行整理,概括,顯現其分布特征的統計方法。 集中量 平均數 # 描述 差異量 標準差S: S大:差異大/不穩定 對個別 S小:差異小/穩定 對個別 統計 相關量:相關系數(表示兩件事情的相互關系)r.r∈[-1,1](r表示從無關道完全相 關,相關:正相關,相關,負相關) 2. 推斷統計 參數估計:#→µ s→σ 推斷 r→р 統計 假設檢驗:參數檢驗 非參數檢驗 3. 實驗設計 ↓ 初級的,用平均數,百分比 ↓ 后來,平均數 → T檢驗(2個對象) 標準差 ↓ 中級的,(2個或2個以上對象)(方差分析)下檢驗。 ↓ 高級的,相關回歸(用相關系數) ↓ 再高級的,(研究生學) 因素分析(探索性的)兩兩相關,寫相關系數 ↓ 更高級的,協方差結構方程(驗證性的) 前程:相同符號的一串→非參數檢驗中的一種 第二章 數據整理 &1.數據種類 一.間斷變量與連續變量 eg:人數 ~ 間斷 二.四種量表。 1.稱名量表。 Eg:307室,學好,電話好嗎 不能進行數學運算(也包括不能大小比較) 2.順序量表。Eg:名次。能力大小,不能運算 3.等距量表。可以運算(做加減法),不能乘除 要求:沒有絕對0 年齡有絕對0 時間(年代,日歷。。。)位移無絕對0,可能有相對0,即有正負 4.等比量表。可做乘除法。 要有絕對零。 成績中的,0分不是絕對0(因為并不說明此人一竅不通) 分數代表的意義。Eg:0~10分 與90~100分。 每一分的“距離”不一樣 因為嚴格來說,成績是順序量表。但為了實際運用中的各種統計,把它作為等距量表 &2.次數分布表 一. 簡單次數分布表 eg: 組別 次數(人次) 100 2 90~99 5 80~89 14 70~79 15 60~69 7 60分以下 3 1. 求全距 R=Max – Min(連續變量) (間斷變量)——R=Max-Min+1 2. 定組數 K(組數)=1.87(N-1)。。。 →取整 N-總數 3. 定組距 I=R/K。一般,取奇數或5的倍數(此種更多)。 4. 定各組限 5. 求組值 X=(上限+下限)/2 上限——指最高值加或取10的倍數等) 6. 歸類劃記 7. 登記次數 例題: 99 96 92 90 90 (I) R=99-57+1=43 87 86 84 83 83 82 82 80 79 78 (II)K=1.87(50-1)。。。≈9 78 78 78 77 77 77 76 76 76 76 75 75 74 74 73 (III)I=R/K =43/9≈5 72 72 72 71 71 71 70 70 69 69 68 67 67 67 65 (iu)組別 組值 次數 64 62 62 61 57 95~99 97 2 90~94 92 3 85~89 87 2 80~84 82 6 75~79 77 14 70~74 72 11 65~69 67 7 60~64 62 4 55~59 57 1 總和 50 二. 相對(比值)次數分布表。 累積次數分布表 相對(比值)累積次數:累積次數值/總數N 注:一般避免不等距組(“以上”“以下”稱為開口組) 相對次數 累積次數(此處意為“每組上限以下的人次)”小于制“ .04 50 .06 48 .04 45 .12 43 .28 37 .22 23 .14 12 .08 5 .02 1 1.00 &3.次數分布圖 一.直方圖 1. 標出橫軸,縱軸(5:3)標刻度 2. 直方圖的寬度(一個或半個組距) 3. 編號,題目 4. 必要時,頂端標數) 圖 二.次數多邊圖 1. 畫點,組距正中 2. 連接各點 3. 向下延伸到左右各自一個組距的中央 最大值即y軸最大值 相對次數分布圖,只需將縱坐標改為比率。(累積次數,累積百分比 也同樣改縱坐標即可)”S形”曲線是正態分布圖的累積次數分布圖 圖(略) 第三章 常用統計量數 &1.集中量 一.算術平均數 公式 算術平均數的優缺點。P36~37 算術平均數的特征。Σ(X-#)=0 離(均數)差 Σ(X-#)(X-#)取#時,得最小值 即:離差平方和是一最小值 二.幾何平均數 #g= 略 long#g=1/NσlogXi 根據按一定比例變化時,多用幾何平均數 eg: 91年 92 93 94 95 96 12% 10% 11% 9% 9% 8% 求平均增長率 xg= 加權平均數 甲:600人 #=70分 乙:100人 #=80分 加權平均數:#=(70*600+80*100)/(600+100) (總平均數)eg:600人,100人 簡單平均數:(70+80)/2 三.中(位)數。(Md) 1.原始數據計算法 分:奇、偶。 2.頻數分布表計算法(不要求) 3.優點,缺點,適用情況(p42) 四.眾數(Mo) 1.理論眾數 粗略眾數 2.計算方法:Mo=3Md-2# Mo=Lmo+fa/(fa+fb)*I 計算不要求 3.優缺點 平均數,中位數,眾數三者關系。 &2.差異量數 一.全距 R=Max-Min 二.平均差(MD或AD) MD={Σ|x-#(或Md)|}/N 三.方差 總體方差的估計值 S2 =Σ(X - #)2 反編 樣本的方差:σ2 x有編 N很小時,用S2 估計總體 N>30時,用S2 或σ2 x 都可以 計算方法:σ2 x=Σx2 /N - (ΣX/N) 2 標準差σx=σ2 x2/1 四.差異系數(CV) CV=σx/# *100% CV∈[5%,35%] 3個用途 五.偏態量與鋒態量(SK) 1.偏態量:sk=(#-Mo)/σx 動差(一級~四級) a3= Σ(x-#)3 、 / N/σx3 三級動差計算偏態系數) 2.峰態量:高狹峰 a4>0 (a4=0 ——正態峰) 低調峰。A4<0 用四級動差 a4=Σ(X - #)4/N/σx4-3 &3.地位量數 一.百分位數 eg30=60(分) “60分以下的還有30%的人” 二.百分等級 30→60(在30%的人的位置上,相應分數為60) So→Md 第四章 概率與分布 &1.概率 一.概率的定義 W(A)=m/n (頻率/相對頻數) 后驗概率: P(A)=lim m/n 先驗概率:不用做試驗的 二.概率的性質和運算 1.性質:o≤P≤1 p=1 必然可能事件 p=0 不可能事件 2.加法。 P(a+b)=P(a)+P(b) “或”:兩互不相克事件和。 推廣:“有限個” P(A1+A2+…+An)=P(A1)+P(A2)+…+P(An) eg:(1)A=出現點數不超過4(x≤4) P(A)=P(x=1)+P(x=2)+P(x=3)+P(x=4)=1/6+…1/6=4/6=2/3 (2)完全憑猜測做判斷題,(共2道),做對1題的概率為: A={T.Ti B={F.Ti C={T.Fi D={F.Fi P=P(B)+P(C)=1/4+1/4=0.5 3.乘法: P(A1,A2…An)=P(A1),P(A2)…P(An) Eg1)四選1。(十道)完全憑猜測得滿分得概率:(1/4)*(1/4)…*(1/4)=1/410 &2.二項分布 一.二項分布 P(x)=Cnxpxgn-x 做對的概率 px :做錯的概率 gn-x :X:對的數量pxgn-x ——每一種 分情況的概率。一種情況:pxgn-x 再乘上系數。 Eg:產品合格率為90% 取n=3(個) TTT的情況 90 * 90*90=P3 0.729 TFT 90*0.10*90=P2g1 0.081 兩個合格的情況→ TTF FTT 其概率 C32P2g1=3p2g1. Cn0P0gn+CnP1gn-1+…+CnPng0=1 注:二項分布可能的結果只有兩種。F 0r T 合格 Or 不合格 選對 Or 選錯 例:(1)10道是非題,憑猜測答對5,6,7,8,9,10題的概率?至少答對5題的概率? P(x=5)=C510P5g5=C510(1/2)51/2)5=.24609 P(x=6)=C610P6g4=C610(1/2)6(1/2)4=.20508 P(x=7)=C710P7g3=C710(1/2)7(1/2)3=.11719 =.04395 =.00977 +P(x=10)=C1010P10g0=(1/2)10 =.000098 至少答對5題:P(X≥5) = 0.62306 (2)四選一,猜中8,9,10題的概率? P(x=8)=C819P8g2=C819(1/4)8(3/4)2=.0039 二.二項分布圖(P84~85) 三.二項分布的平均數與標準差(前提np≥5且ng≥5) 平均數——M=np 標準差——r=npg1/2 &3.正態分布 一.正態分布曲線 二.標準正態分布。(P387附表可查面積P) Z=(x-ц)/r (x:原始分數) 標準分數(有正有負) ΣZ=0 三.正態分布表的使用 查表 P(0≤Z≤1)=0.34134——Z的范圍中的人數比例(百分數) P(0≤Z≤1.645)=0.4500 1.64 - .44950=0.45 1.65 - .45053=0.45 之上,標準分數高于2個標準差,則非常聰明。 Eg:1. μ=70(分) σ=10 P(70≤x≤80)=p(o≤z≤1) P(60≤x≤70)=P(-1≤z≤0) 2.μ P(0≤z≤1)=P(μ≤x≤μ+σ) P(-1≤z≤0)=P(μ-σ≤x≤μ) 圖(略) 例:某地區高考,物理成績 μ=57。08(分) σ=18。04(分) 總共47000人。 (1)成績在90分以上多少人? (2)成績在(80,90)多少人? (3)成績在60分以下多少人? 解: X~N(57.08,18.042) —— 參數(μ,σ2) Normal 表示符合正態分布 令Z= (x-57.08)/18.04) ,則Z~N(0,12)標準分數平均數一定為0,標準差一定為1。 (1)Z1=(90-57。08)/18.04=1.82 P(Z>1.82)=.0344 N1=np=47000*0.0344=1616(人) (2)Zz=(80-57.08)/18.04=1.27 P(1.27<Z<1,82)=.46562-.39796=0.677 N2=NP=3177(人) (3)Z3=(60-57.08)/18.04=0.16 P(Z<0.16)=.56356 N3=26487(人) 四.正態分布的應用 T=KZ+C T~N(C,K2) IQ=15Z+100 IQ=100 一般 IQ≥130 ——超常 (30=2x*15) IQ<70 —— 弱智 70幾 ——bndenline eg:1.某市參加一考試2800人,錄取150人,平均分數75分,標準差為8。問錄取分數定為多少分? 解: X~N(75.82) Z=(x-#)/σx=(x-15)/8 ~N(0,12) P=150/2800=0.053 0.5-0.053=0.447 Z=1.615 X=1.615*8+75≈88(分) 2.某高考,平均500分,標準差100分,一考生650分,設當年錄取10%,問該生是否到錄取分? 解: Zo=(650-500)/100=1.5 (X~N(500,1002)(Z~N(0,12) Po=0.5-0.43319=0.06681=6.681%<10% 所以可錄取。 第五章 抽樣分布(概率P) &1.抽樣方法 一. 簡單隨機抽樣 二. 等距抽樣 三. 分層抽樣 四. 整群抽樣 五. 有意抽樣 &2.抽樣分布 (1) (2) (3) (4) (5) 20 25 30 35 40 (1) #=20 22.5 25 27.5 30 (2) 22.5 25 27.5 30 32.5 (3) 25 27.5 30 32.5 35 (4) 27.5 30 32.5 35 37.5 (5) 30 32.5 35 37.5 40 總體分布 圖 抽樣分布 圖 一.平均數 E(#)=µ 二。標準差,方差。 σx=σ/n1/2 σ#2=σ2/n &3.樣本均值(#)的抽樣分布 一.總體方差σ2已知時,#的抽樣分布 1.正態總體,σ2 已知時,#的抽樣分布 設(X1,X2,…Xn)為抽自正態總體X~N(μ, σ2 ) 的一個簡單隨機樣本,則其樣本均值#也是一個正態分布的隨機變量,且有: E(#)=μ, σx2 =σ2 /n 即#~N(μ, σ2 /n) Z=(#-μ)σ/n1/2 Eg:一次測驗,μ=100 σ=5 從該總體中抽樣一個容量為25的簡單隨機樣本,求這一樣本均值間于99到101的概率? 解: 已知X~N(100,52) n=25. 則#~N(100,12) Z=(#-100)/1 ~ N(0,1) 當#=99時,Z=-1 當#=101時,Z=1 所以P(99≤#≤101) =P(-1≤Z≤1)=.68268 2.非正態總體,σ2已知時,#的抽樣分布 設(X1,X2,…Xn)是抽自非正態總體的一個簡單1隨機樣本。當n≥30時,其樣本均值# 接近正態分布,且有: E(#)=μ, σx2 =σ2 /n 即#~N(μ, σ2 /n) 若是小樣本,題目無解。 Eg(1)一種燈具,平均壽命5000小時,標準差為400小時(無限總體)從產品中抽取100盞燈, 問它們的平均壽命不低于4900小時的概率。 解:已知:μ=5000,σ=400,n=100>30是大樣本 所以#近似正態分布 #~N(5000,402) 當#=4900時,Z=(4900-5000)/400/1001/2=-2.5 P(#≥4900)=P(Z≥-2.5)=0.99379 3.有限總體的修正系數 (引出)(2)同上題,從2000(有限總體)盞中不放回地抽取100盞,問。。。。。 (概念)設總體是有限的總體,其均值為μ,方差為σ2 (X1,X2…Xn)是以不放回形式從該總 體抽取的一個簡單隨機樣本。則樣本均值#的數學期望(E(#))與方差為 E(#)=μ#=μ 和σ2 =(N-n)/(N-1)*( σ2 /n) N→∞時,修正系數不計。 σ=[(N-n)/(N-1)*( σ2 /n)]1/2 .n/N≥0.05%,要用修正系數 如題(2),n/N=0.05 所以要用修正系數 所以解題2:σx2 =(N-n)/(N-1) *( σ2 /n)=2000-100)/2000-1=4002 /100=1520 σ#=15201/2 =38.987 Z=(4900-5000)/38.987= -2.565 P(Z≥-2.565)=.9949 二.總體方差σ2 未知時,樣本均值#的抽樣分布。 用S2(總體方差的估計值)代替 σ2 t=(x-μ)/s/n1/2 ~tn-1→dp(自由度)=n-1 設(X1,X2,…Xn) 為抽自正態總體的一個容量為n的簡單隨機樣本,即t=(x-μ)/s/n1/2符合自由度為n-1的t分布 當總體為非正態分布,且σ2 未知。 則樣本 小:無解 大:接近七分布 t≈ t=(x-μ)/s/n1/2 ~ tn-1 Z≈ t=(x-μ)/s/n1/2 ~ N(0,1)(也可用Z) 總體均值為80,非正態分布,方差未知,從該總體中抽一容量為64的樣本,得S=2,問樣本均值大 于80.5得概率是多少? 解:因為64>30 是大樣本 P(#>80.5)=P(t>(x-μ)/s/n1/2 )=P(t>2) df=63 P≈0.025 若用Z,P(Z>z) ≈0.02275 (若N24,總體正態,則Z分布1不能用,只能用七分布) 非正態總體:小樣本——無解 大樣本——Z≈(x-μ)/σ/n1/2 σ2 已知 正態總體 Z=≈(x-μ)/σ/n1/2 非正態總體:小樣本 —— 無解 σ2 未知: 大樣本——t≈(x-μ)/σ/n1/2 ≈Z 正態總體:小樣本——t=(x-μ)/σ/n1/2 大樣本——Z≈t=(x-μ)/σ/n1/2 &3.兩個樣本均值之差(#1-#2)的抽樣分布 若#1是獨立地抽自總體X1~N(μ1,σ2 )的一個容量為n,的簡單隨機樣本的均值; #是。。。X2~N(μ2, σ22 )的。。。n2.的。。。則兩樣本均值之差(#1-#2)~N(μ1-μ2,σ12/n1,σ22/n2) 復雜計算 一種鋼絲的拉強度,服從正態分布 總體均值為80,總體標準差6,抽取容量為36的簡單隨機樣本,求樣本均值∈[79,81]的概率 X~N(80,62) Z~N(0,12) Z=(x-μ)/6/361/2 =(x-8)/1 x∈[79,8081] Z ∈[-1,1] P=.68268 若σ不知。S=b,則 X~(80, σ2 ) 用公式t=(# -μ)/s/n1/2 ~ tn-1 =t35 某種零件平均長度0.50cm,標準差0.04cm,從該總零件中隨機抽16個,問此16個零件的平均長度小 于0.49cm的概率無解。 抽100個,則概率? Z≈(x-μ)/σ/n1/2 =(# - 0.50)/0.004 #<0.49 P(Z<-0.01/0.004) =P(Z<-2.5)=.49379= 從500件產品中不放回地抽25件。 25/500=0.05 要修正系數(N-n)/(N-1)≈.95 某校一教師采用一種他認為有效的方法,一年后,從該師班中隨機抽取9名學生的成績,平均分 84.5分,S=3。而全年級總平均分為82分,試問這9名學生的#<84.5分的概率為多大? #~N(82, σ2 ) t~t8 t=(# -μ)/s/n1/2 =84.5-82)/3/3=2.5 df=8 0.975≤P(t<2.5) 說明方法有效 (S=3是σ的估計值,兩組數據都很整齊。圖(略) &4.有關樣本方差的抽樣分布 一.f2分布 1.f2 分布的密度函數 f(x)=1/2n/2*r*n/2)* e-x/2*xn/2-1 (x>0) f(x)=0 (x≤0) 圖(略) 2.定理: 設(X1,X2,X3…Xn)為抽自正態總體 X~N(μ,σ2 )的一個容量為n的簡單隨機樣本, 則#=∑(X-#)2/n-1為相互獨立的隨機變量,且#~N(μ, σ2 /n) ∑(X-#)2 /σ2 =(n-1)S2 /σ2 ~X2n-1(I=1,2,…n) 若抽自非正態總體:小樣本 —— 無解 大樣本 —— X2≈((n-1)S2 /σ2 二.F分布 1.F分布的密度函數 f(x)= [(n1+n2)/2]/(n1/2)(n2/2) (n1/n2)(n1/n2*X)n1/2-1(1+n1/n2*X)-n1+n2/2 (x≥0) f(x)=0 (x<0) 2.定理 設(X1,X2,…Xn)為抽自X~N(μ1, σ2 1)的一個容量為n1的簡單~(y1,y2…yn)為抽自正態總體 y~N(μ2, σ2 2)的一個容量n2的簡單~,則: 當σ2 1=σ2 2時, F=S21/S22~F(n1-1,n2-1) n1~分子自由度 n2~分母自由度 第六章 參數估計(置信水平下的區間估計) &1.點估計 E(X)(即#)=∑x/N→μ (拿一個點來估計參數) D(X)= ∑(x-#)2 /N-1→σ2 &2.總體均值的區間估計 一.總體均值的區間估計,σ2 已知。 正態總體 x~N (μ, σ2 ) #~N((μ, r2/n) Z=(# -μ)/ σ/n1/2 1. 某種零件的長度符合正態分布。σ=1.5,從總體中抽200個作 為樣本,#=8.8cm,試估計在 2. 95%的置信水平下,全部零件平均長的置信區間。 解: 已知X~N(μ,1.52 ) n=200, #=8.8 1-a=0.95 →a-0.05 Z0.025=1.96 P(#-Za/2σ/n1/2 <μ<#+Za/2 n1/2 =P(8.59<μ<9.01)=0.95 10%>5% 若不放回地從2000個(總體)中抽出200個。——需修正系數 所以用(N-n)/(n-1)1/2 P(# +- 1.96*σ/n1/2 *(N-n)/(n-1)1/2 =0.95=P(8.60,9.00) 二 σ2 未知 P(#-t(a/2,n01)S/ n1/2 <μ<#+t(a/2,n-1) S/ n1/2 )=1-a 為了制定高中學生體鍛標準,在某區隨機抽36名男生測100米,36名學生平均成績13.5 秒,S=1.1秒,試估計在95%地置信水平下,高中男生100米跑成績的置信區間。 P(# + - 2.03* S/ n1/2 )=P(13.5+- 2.03*1.1/361/2 )=9.5 (13.5+-0.37) 即(13.13,13.87) 得(13.14,13.86) |
回復話題 |
||
上傳/修改頭像 |
|
|