107年特種考試地方政府公務人員考試
等別:五等考試
類科 :統計
科目:統計學大意
類科 :統計
科目:統計學大意
1.為了要決定某藥對疾病之醫療效果,對 23 位病人施予投藥,而對另外 23 位病人給予安慰劑。前述蒐集資料的方式,稱為:
(A) 觀察研究 (B) 實驗設計 (C) 模擬 (D) 調查
該方式區分實驗與對照,並經設計後施行,故選(B)
(A) 用錯誤資料所得的中位數不是正確的
(B) 用錯誤資料所得的四分位距( interquartile range)不是正確的
(C) 正確的變異數應比用錯誤資料所得變異數小
(D) 正確的變異係數(coefficient of variation)應比用錯誤資料所得的變異係數大
解:
原資料範圍為−90至190,錯誤資料範圍為−99至199,即正確的資料範圍較小,故選(C)
解:{樣本平均數ˉx=∑xi/n=320/10=32樣本標準差sx=√∑(xi−ˉx)2(n−1)=√∑x2i−(∑xi)2/nn−1=√10434−3202/109=√1943=4.64{樣本平均數ˉy=∑yi/n=320/10=32樣本標準差sy=√∑y2i−(∑yi)2/nn−1=√10270−3202/109=√303=1.83⇒(32,4.64);(32,1.83),故選(C)
(A) 當一組資料均為正偏時,平均數≦ 眾數≦ 中位數
(B) 若一組資料的平均數、眾數、中位數皆相等時,則變異數不為零
(C) 當一組資料均為負偏時,平均數≦ 中位數≦ 眾數
(D) 若一組資料的眾數、中位數及平均數愈大,則其全距也會愈大
解:
負偏態:高峰在右,即平均數≦ 中位數≦ 眾數;
正偏態:高峰在左,即眾數≦ 中位數≦ 平均數;
正態:高峰在中間,即眾數= 中位數= 平均數;
故選(C)
(A) 一致分配 (B) t 分配 (C) 指數分配 (D) 常態分配
解:依中央極限定理(de Moivre - Laplace)二項分布的極限為常態分布,故選(D)
(A) 約有 95%資料落在 8 至 32 之間
(B) 約有 95%資料落在 52 至 92 之間
(C) 至少有 75%資料落在 11 至 29 之間
(D) 至少有 75%資料落在 8 至 32 之間
解:
該資料並非常態分布,僅能以柴比雪夫不等式來推估即P(|X−μ|<kσ)≥1−1k2⇒P(|X−20|<2×6)≥1−122⇒P(8<X<32)≥34=75%,故選(D)
7. 下列何種方法非用來檢測資料是否來自近似常態分配?
(A) 計算 x ± s , x ± 2s ,及 x ± 3s 區間,落在各區間測量值百分比約各是 68%, 95%,與 99.7%
(B) 建構直方圖或莖葉圖,圖形應是一致(均勻)分配
(C) 求樣本內四分位距(IQR)與標準差(S),則 IQR / S ≈ 1.35
(D) 建立常態機率圖,資料點應大約落在一直線上
解:均勻分配並非常態分配,故選(B)
(A) 0.2228 (B) 0.2229 (C) 0.2230 (D) 0.2231
解:
10 天會收到三個訂單,平均每天會收到λ=3/10個訂單;
至少 5 天之久,才會有下個訂單,代表連續五天都沒有訂單;
由卜松分配可知: P(X=x)=e−λλx/x!⇒P(X=0)=e−λ;
五天都沒有訂單的機率:P5(X=0)=e−5λ=e−3/2=0.2231(查試題附表),故選(D)。
至少 5 天之久,才會有下個訂單,代表連續五天都沒有訂單;
由卜松分配可知: P(X=x)=e−λλx/x!⇒P(X=0)=e−λ;
五天都沒有訂單的機率:P5(X=0)=e−5λ=e−3/2=0.2231(查試題附表),故選(D)。
(A) 不成對 t 檢定,拒絕上課無法增加信用分數
(B) 成對 t 檢定,拒絕上課無法增加信用分數
(C) 不成對 t 檢定,無法拒絕上課無法增加信用分數
(D) 成對 t 檢定,無法拒絕上課無法增加信用分數
解:
由於檢定統計值>上臨界值,因此拒絕H0:上課前後分數相等,故選(B)
(A) 介於 0.05 及 0.1 之間 (B) 介於 0.025 及 0.05 之間
(C) 介於 0.01 及 0.025 之間 (D) 介於 0.005 及 0.01 之間
解:
P(X>27)=P(T>27−253/√15)=P(T>2.582)查試題附表可知:{t0.025(14)=2.1448t0.01(14)=2.6245⇒t0.025(14)<2.582<t0.01(14)⇒0.01<P(T>2.582)<0.025,故選(C)
(A) 0.985 (B) 0.965 (C) 0.945 (D) 0.895
解:由(n−1)s2σ2∼χ2(n−1)推估:P(9.81<s2<90.405)=P((9−1)×9.8136<(9−1)×s236<(9−1)×90.40536)=P(2.18<χ2<20.09)查試題附表(自由度=9−1=8)可得{P(χ2>20.0902)=0.01P(χ2>2.1797)=0.975⇒P(2.18<χ2<20.09)=0.975−0.01=0.965,故選(B)(A) 迴歸解釋的標準差占總標準差的比例;相關係數的平方等於判定係數
(B) 迴歸解釋的變異占總變異的比例;相關係數的平方等於判定係數
(C) 迴歸解釋的標準差占總標準差的比例;相關係數開根號等於判定係數
(D) 迴歸解釋的變異占總變異的比例;相關係數開根號等於判定係數
解:由定義可知:{判定係數R2=(Cov(X,y))2Var(X)Var(Y)相關係數γ=Cov(X,y)√Var(X)√Var(Y)⇒γ2=R2,故選(B)
(A) S/N (B) 2S/n-1 (C) (N+1)/2 (D) S(S+1)/2
解:{母體平圴數μ=(1+2+⋯+N)÷N=(N+1)/2樣本平均數¯X=S/n⇒由¯X推估μ,即Sn=N+12⇒N=2Sn−1,故選(B)
(A) 19 元 (B) 95 元 (C) 20 元 (D) 92 元
解:點數相同的樣本空間S={(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}⇒P(S)=636=16假設每次玩此遊戲需付x元,則期望值為95×16−x×56=0⇒x=955=19,故選(A)
(A) 0.0384 (B) 0.1321 (C) 0.0128 (D) 0.0012
解:t=14.3−141.2/√50−1=74=1.75查試題附表可得{t50,0.05=1.6759t50,0.025=2.0086⇒0.025<P(t>1.75)<0.05,故選(A)註:試題未附Z表,且t表僅有n=50,沒有n=49,僅能推估;
(A) (0.722, 0.878);無法 (B) (0.762, 0.838);可以
(C) (78.04%, 81.96%);無法 (D) (62.469%, 97.531%);可以
解:95%信賴區間為ˉp±zα/2×√ˉp(1−ˉp)n=0.8±1.96×√0.8(1−0.8)100=0.8±0.0784=(0.8−0.0784,0.8+0.0784)=(0.7216,0.8784);又0.9不在該區間內,故選(A)
(A) (0.837, 3.663);不相等 (B) (0.847, 3.753);相等
(C) (0.867, 3.843);不相等 (D) (0.887, 3.820);相等
解:
題目有疑義,故(送分)
(A) 約 70% (B) 約 85% (C) 約 55% (D) 約 95%
解:A地區檢測到此土壤存在的機率PA=0.5×0.7+0.2×0.9+0.3×0.3=0.62A地區檢測到此土壤存在且位於油田的機率PB=0.5×0.7+0.2×0.9=0.53挖到油的機率為PB/PA=0.53/0.62=0.8548≈85%,故選(B)
(A) 0.1847 (B) 0.1991 (C) 0.5438 (D) 0.6472
解:P(X≥5)=1−P(X≤4)=1−4∑k=0P(X=k)=1−0.8153(查試題附表,λ=3)=0.1847,故選(A)註: 一般「超過五次」應該是P(X>5)=P(X≥6),若依此則無答案可選!!
(A) 0.5 年 (B) 1 年 (C) 1.5 年 (D) 2 年
解:P(X≤x)=2.5%⇒P(Z≤x−μσ)=P(Z≤x−31)=2.5%=0.025由z2=0.975⇒z−2=1−0.975=2.5%⇒x−31=−2⇒x=1,故選(B)解:
sourceDFSSMSSFtreatment4−1=311700−10800=900900÷3=300300÷300=1error39−3=36300×36=10800300total10×4−1=3911700,故選(D)
(A) 如果0 ≤ x ≤ 10,則 0 ≤ f (x)≤1, 0 ≤ g(x)≤ 1
(B) 如果 X 與 Y 是不相關( uncorrelated),則 X 與 Y 彼此獨立
(C) P(X=3)=f (3)
(D) P(-5 ≤ Y ≤ 0)=g (0)
解:(A)×:0≤x=3.6≤10⇒f(3.6)不存在(B)×:不一定(C)◯:f(x)為離散型⇒P(X=3)=f(3)(D)×:g(y)為連續型,無個別機率值g(0),故選(C)註: 題目g(x)應為g(y)
解:{yi=1+(β−2)xi+εi^yi=1+(β−2)xi⇒εi=yi−ˆyi=yi−1−(β−2)xi令g(β)=∑ε2i=∑(yi−1−(β−2)xi)2=∑(yi−1−βxi+2xi)2⇒g′(β)=0⇒2∑((yi−1−βxi+2xi)(−xi))=2∑(−xiyi+xi+βx2i−2x2i)=0⇒∑βx2i=∑(xiyi−xi+2x2i)⇒β=∑xiyi−∑xi+2∑x2i∑x2i=10−5+2×1515=3515=73,故選(A)
(A) 如果假設為 H0:μ=6 對 H1:μ≠6,則在 5%的顯著水準下,結論是不拒絕虛無假設H0
(B) 如果假設為 H0:μ=7 對 H1:μ≠7 ,則 t 統計量值為 10
(C) 如果假設為 H0:μ=10 對 H1:μ≠10 ,則 p 值( p-value)為 1
(D) 如果樣本數增加至 16,且這 16 個零件長度的標準差亦為 2 公分,則樣本數 16 所得 μ之 95%信賴區間寬度為原來樣本數 4 所得 μ之 95%信賴區間寬度的一半
解:
95%的信賴區間為[6.818,13.182]=[ˉx−1.96s,ˉx+1.96s]⇒{ˉx=10s=2(C)H0:μ=10⇒μ=ˉx,落在信賴區間的中心⇒p=1,故選(C)
解:
ˆyi=β0+β1xi⇒β1=sxysxx=∑(xi−ˉxi)(yi−ˉyi)∑(xi−ˉxi)2=2010=2⇒β0=ˉy−β1ˉx=ˉy−2ˉx⇒∑(ˆyi−ˉy)2=∑(β0+β1xi−ˉy)2=∑(ˉy−2ˉx+2xi−ˉy)2=∑(2(xi−ˉx))2=4∑(xi−ˉx)2=4×10=40因此我們有以下ANOVA表格:sourceDFSSMSSFregression1∑(ˆyi−ˉy)2=404040÷20=2error6−1=5∑(yi−ˉy)2=140−40=100100÷5=20total7−1=6∑(yi−ˉy)2=140,故選(C)
(A) 約 42% (B) 約 83% (C) 約 92% (D) 約 21%
解:假設10件商品的編號為1,2,…,10,其中編號1,2,3的商品有附加贈品;
將10件商品排列,前5件商品給甲,後5件商品給乙,總排列數為10!;
前5件沒有編號1,2,3的可能排列數為P75,而每一個排列出現5!次,因此甲至少拿到1件贈品的機率為1−P75×5!10!=1−7!×5!2×10!=1−112=0.917,故選(C)
解:t∗i=95t+32⇒{¯t∗=95¯t+32s2t∗=8125s2tst∗=95st(A)×:t∗i的變異係數=st∗¯t∗=95st95¯t+32≠st¯t=ti的變異係數(B)×:s2t∗=8125s2t(C)×:Sxt∗=Cov(X,T∗)=Cov(X,95T+32)=95Cov(X,T)+Cov(X,32)=95Cov(X,T)=95Sxts2t=95Sxt(D)◯:t∗1的Z分數=t∗1−¯t∗st∗=(95t1+32)−(95¯t+32)95st=95(t1−¯t)95st=t1−¯tst=t1的Z分數,故選(D)
解:
(C)◯:{s2X=19∑10i=1(xi−ˉx)2s2Y=19∑10i=1(yi−ˉy)2⇒母體變異數σ2的估計量為s2X+s2Y2=118(10∑i=1(xi−ˉx)2+10∑i=1(yi−ˉy)2),故選(C)
(A) 如果 n 是偶數,則 Y 的期望值( expected value)不為 0
(B) 如果 n 是奇數,則 Y 的期望值不為 0
(C) 如果 n 是奇數,則 Y 的變異數為 1
(D) X 與 Y 是正相關( positively correlated),即 X 與 Y 的共變異數( covariance)是正的
解:
X∼B(n,k)⇒P(X=k)=(nk)pk(1−p)n−k=(nk)12n(∵p=12)(A)×:令f(x)=(−x+1)n=n∑k=0(nk)(−1)kxk⇒f(1)=n∑k=0(nk)(−1)k=0⇒E(Y)=∑yP(Y=y)=∑{1⋅P(X=偶數)+(−1)⋅P(X=奇數)}=n∑k=0(nk)(−1)k12n=0⇒無論n是偶數或奇數E(Y)=0(B)×:理由同(A)(C)◯:Var(Y)=∑y2P(Y=y)=∑{12⋅P(X=偶數)+(−1)2⋅P(X=奇數)}=n∑k=0(nk)12n=(12+12)n=1⇒Var(Y)=1(D)×:(X,Y)={(0,1),(1,−1),(2,1),(3,−1),…}並不符合X越大則Y越大的條件,故選(C)
(A) α+β=1
(B) 一般常用的 t 檢定,其 β 的值與顯著水準無關;即當顯著水準改變時, β 的值還是不變
(C) 如果型 II 錯誤是一新型引擎比舊型引擎效能好,但被誤判為並沒有比較好,則虛無假設為新型引擎比舊型引擎效能好
(D) 若兩檢定方法 A 與 B 其型 I 錯誤發生的機率皆在顯著水準之內,但檢定方法 A 其型 II 錯誤發生的機率較低,則其檢定力( power of test)較高
解:
只有(D)正確,故選(D)
解:(B)×:β1∼N(1,1)⇒P(|Z|≤1.645)=0.9(查表z−1.645=0.05)⇒信賴區間=[β1−1.645×1,β1+1.645×1]=[−0.645,2.645],故選(B)
解:Y=β0+β1X+ε⇒Cov(X,Y)=Cov(X,β0+β1X+ε)=β0Cov(X,1)+β1Cov(X,X)+Cov(X,ε)=0+β1Var(X)+0⇒Cov(X,Y)=β1Var(X)又相關係數γ=Cov(X,Y)√Var(X)√Var(Y)=β1Var(X)√Var(X)√Var(Y)=β1√Var(X)√Var(Y)⇒√Var(X)√Var(Y)=γβ1=−0.8−1.6=12⇒σY=2σX,故選(D)
解:(A)×:x=95⇒z=95−806=2.5<3⇒不是離群值(B)◯:x=95⇒z=95−822=6.5>3⇒95在亞太是離群值,符合晉升標準(C)×:P(52<x<88)=P(52−703<z<88−703)=P(−6<z<6)>>95%(D)×:{美洲CV=√12.2585=0.041歐洲CV=√970=0.043⇒美洲CV<歐洲CV,故選(B)
解:X∼B(3,p=1/2)⇒P(X=k)=(3k)12k⋅123−k=(3k)18⇒期望值Ek=800×P(X=k)=100×(3k),k=0,1,2,3;⇒i0123觀察值Oi5030040050期望值Ei100×(30)=100100×(31)=300100×(32)=300100×(33)=100⇒卡方檢定統計量值為3∑i=0(Oi−Ei)2Ei=(50−100)2100+(300−300)2300+(400−300)2300+(50−100)2100=25+0+1003+25=2503,故選(C)
解:P(|¯X−μ|≤20)=0.95⇒P(−20≤¯X−μ≤20)=0.95⇒P(−20σ/√n≤¯X−μσ/√n≤20σ/√n)=P(−20200/√n≤Z≤20200/√n)=P(−√n10≤Z≤√n10)=0.95⇒√n10=1.96⇒n=19.62=384.16,故選(C)註:試題未附Z表,可改查T表,t400,0.025≈1.96!!
解:(A)×:∑f(x)=1⇒k2−8k+84+k2+14=k2−6k+94=1⇒k2−6k+5=0⇒k=1(∵k2<1,k=5不合)(B)×:P(20≤X<30)=P(20)=k2≠2k+14(C)◯:∑xP(X=k)=10×k2−8k+84+20×k2+30×14=10×14+20×12+30×14=20(D)×:P(−10<X<10)=0故選(C)
解:(A)×:P((B1∪B2)∩A1)=50+100300=150300≠150200(B)◯:{P(A2)=10+50+40300=13P(B2)=100+50300=12⇒P(A2∩B2)=50300=16=P(A2)×P(B2)(C)×:P(A2∪B2)=(10+50+40+100)/300=23≠56(D)×:P(B1∣A1)=P(B1∩A1)/P(A1)=50/(50+100+50)=14≠16,故選(B)
解:總平均ˉˉx=6×(ˉx+ˉy+ˉz)18=6(70+60+80)18=70⇒SST=6∑i=1(xi−ˉˉx)2+6∑i=1(yi−ˉˉx)2+6∑i=1(zi−ˉˉx)2=6∑i=1x2i+6∑i=1y2i+6∑i=1z2i−140(6∑i=1xi+6∑i=1yi+6∑i=1zi)+36∑i=1ˉˉx2=29900+22100+38900−140(6×70+6×60+6×80)+3×6×702=2700SSW=6∑i=1(xi−ˉx)2+6∑i=1(yi−ˉy)2+6∑i=1(zi−ˉz)2=6∑i=1x2i−(6∑i=1xi)2/6+6∑i=1y2i−(6∑i=1yi)2/6+6∑i=1z2i−(6∑i=1zi)2/6=29900−4202/6+22100−3602/6+38900−4802/6=1500⇒SSB=SST−SSW=2700−1500=1200因此有以下ANOVA表格:sourceSSDFMSF組間2700−1500=12003−1=21200÷2=600600÷100=6組內150017−2=151500÷15=100總和270018−1=17由以上表格可知,只有(A)正確,即MSSB=1200÷2=600,故選(A)
解:(B)×:有限母體ˉP的變異數應為N−nN−1×p(1−p)n,故選(B)
解:
(A)×:{第1份問卷支持率p1=90/400=9/40第2份問卷支持率p2=360/1600=9/40⇒p1=p2=p⇒{標準差σ1=√p(1−p)n1=√p(1−p)400=√p(1−p)20標準差σ2=√p(1−p)n2=√p(1−p)1600=√p(1−p)40⇒σ1=2σ2⇒第1份問卷的信賴區間是第2份的兩倍(B)×:兩份問卷支持率相同,但標準差不同,所以p−value 也不同(C)×:z0.95>z0.9⇒95%信賴區間>90%信賴區間(D)◯:{第1份問卷zA=9/40−0.2√9/40(1−9/40)400=1.197第2份問卷zB=9/40−0.2√9/40(1−9/40)1600=2.395z0.025=1.96⇒zB>z0.025>zA,故選(D)
沒有留言:
張貼留言