Processing math: 78%

網頁

2021年1月13日 星期三

110年初等考試-統計學大意詳解

110年公務人員初等考試-統計學大意

1. 當柴比雪夫定理應用在機率分配上時, 下列敘述何者正確?
(A)該定理只適用在對稱的機率分配上
(B)大約 68%的觀測值會落在平均數上下一個標準差之內
(C)至少 25%的觀測值會落在平均數上下兩個標準差之內
(D)至多 11%的觀測值會落在平均數上下三個標準差之外

P(μkσ<X<μ+kσ)11k2(A)×:(B)×:k=1P(μσ<X<μ+σ)111=0(C)×:k=2P(μ2σ<X<μ+2σ)1122=0.75(D):k=3P(μ3σ<X<μ+3σ)1132P(μ3σ<X<μ+3σ)19=0.11(D)

2. 假設 E 和 F 為兩個非空集合的事件且滿足P(FE)=P(F), 下列敘述何者錯誤?
(A)P(E and F)=P(E)P(F)  (B)P(E or F)=P(E)+P(F)
(C)E 和 F 為相互獨立事件  (D)P(EF)=P(E)


(A):P(FE)=P(F)P(FE)P(E)=P(F)P(FE)=P(F)P(E)(B)×:P(EF)=P(E)+P(F)P(EF)=P(E)+P(F)P(E)P(F)(C):(A)E,F(D):P(EF)=P(EF)P(F)=P(E)P(F)P(F)=P(E)(B)(B)

3. 美國密西根州 55%的公民是男性, 45%的公民是女性。 已知本次總統大選該州 60%的男性和 40%的女性投票給共和黨候選人。 請問票投給共和黨候選人的密西根州公民之中, 屬於男性的機率有多少?
(A)0.605  (B) 0.736  (C)0.647  (D)0.338

=0.55×0.60.55×0.6+0.45×0.4=11170.647(C)

4. 隨機變數 X 服從指數分配( exponential distribution) , 其機率密度函數為f(x)=0.5e0.5x,x>0。 請問該指數分配的中位數為多少?
(A)2.008  (B)1.649  (C) 1.386  (D) 2.685


aa0f(x)dx=0.5a00.5e0.5xdx=0.5[e0.5x]|a0=0.51e0.5a=0.5e0.5a=0.50.5a=ln0.5a1.386(C)


5. 下列為 108 年公務人員初等考試統計學科目分數的箱型圖( box plot) :
根據此圖, 請問此考試分數的前標( 第 75 百分位數) 和後標( 第 25 百分位數) 相差幾分?
(A)22 (B) 41  (C) 67  (D) 90

40(B)

1823882328917283372433386303843636()<<(A)

7. 2019 年商學院學生的 TOEIC 成績大約服從一個常態分配, 平均分數μ=610, 標準差σ=160。某大學 MBA 學程給外國學生的獎學金申請最低門檻是 TOEIC 成績前 3%。 請問 TOEIC 至少要考幾分才能到達此最低門檻?
(A)932 (B) 911  (C) 895  (D) 876

z滿P(Zz)=13%=0.97():z1.88z=xμσ=x610160=1.88x=160×1.88+610=910.8(B)


 (A)×:n1(A)

9. 當使用 T 分配來建立母體平均數的信賴區間時, 下列何者假設是不需要的?
(A) 樣本平均數的分配必需是常態或近似常態分配
(B) 母體的標準差未知 
(C) 樣本數必需很大
(D) 樣本觀測值之間相互獨立

ˉx±tα/2sn(C)

10. 民調公司想要了解美國公民對現任總統的支持度百分比。 在信心水準 95%和誤差範圍 5%的要求之下, 請問該民調公司至少需要多少樣本數?
(A) 297  (B) 385  (C) 897  (D) 1,067

n(zα/2×pe)2,{95%α=0.05e=5%p=1/2n(z0.025×0.50.05)2=(1.96×0.50.05)2=384.16(B)


11. 有關母體參數假設檢定的 P 值( P-value) , 下列敘述何者錯誤?
(A)P 值的計算和顯著水準有關  (B)P 值的計算和虛無假設有關
(C)P 值的計算和樣本的檢定統計量有關  (D)P 值越小, 越傾向於拒絕虛無假設

PP(A)


(B)(D)(A)(C)B(C)


 

t81=7(D)

14. 如果執行卡方適合度檢定( 顯著水準為α ) 時有許多細格( cell) 的期望次數太少, 會造成下列那一種影響?
(A)該檢定比較容易拒絕 H0  (B)該檢定的檢定力會變小
(C)該檢定的檢定統計量自由度會變少  (D)不會有任何的影響


H0(A)

 


(k=3)15(n=15)(a,b)=(31,151(31))=(2,12)(A)




FA130dfA=41=3BdfB=51=4270dfAdfB=3×4=12MSAB=270/12480N4×5=40MSE=480/40100059=N1N=60F=MSAB/MSE=27012÷48040=158=1.875(B)


XYXY(D)

 


R2=SSRSST=300900=0.333=33.3%(A)


 


y=0()(A),(B);xyˆyY(D)(C)



.
II:H0(A)(B)(C)(D)(C)




ρ=(xˉx)(yˉy)(xˉx)2×(yˉy)2=3630×48=310=(yˆy)2N2=(1ρ2)(yˉy)2N2=(19/10)×4813=24650.6076(D)

22. 在複迴歸的模型中加入一個具有高度共線性( collinearity) 的自變數所造成的影響, 下列敘述何者錯誤?
(A)最小平方法的估計式可能會不存在
(B)R2(判定係數) 可能會變小
(C)某些自變數 X 和 Y 之間的關係可能會被錯誤解釋
(D)某些自變數 X 的係數估計值可能會由正轉成負


:共線性會造成重複的自變數,提高某一自變數的解釋力與預測力,也就是R2變大,故選(B)

23. 資料中有收入( 低、 中、 高) 及年齡群( 21 歲-30 歲、 31 歲-40 歲、 41 歲-50 歲、 51 歲-60 歲) 兩個變數。 若要以卡方檢定( Chi-square) 檢定收入與年齡群有無關聯性, 其自由度為何?
(A) 6  (B) 7   (C) 8   (D) 12

34=(31)(41)=6(A)


24. 下列那一個假設檢定的程序不適合採用卡方統計量來做檢定?
(A)檢定多組獨立的數值資料是否來自相同的機率分配
(B)檢定 Spearman 的等級相關係數( coefficient of rank correlation) 是否顯著
(C)檢定“性別” 和“支持的政黨” 之間是否有關係
(D)檢定迴歸分析的殘差項是否相互獨立

(B)

25. 根據世界綠色和平組織的抽樣調查和迴歸分析, 得到一個估計式ˆY=0.5+0.006X, 其中 Y 為大氣增加的溫度( 華氏℉) , X 為空氣中二氧化碳濃度的增加量( PPM) , 且R2高達 0.92。 如果現在將同一筆資料溫度 Y 的單位改成攝氏( ℃) , 並重新計算迴歸估計式, 則下列敘述何者正確? ( 註: 華氏=攝氏×95+32)
(A)迴歸估計式的截距項變成-31.5
(B)R2數值不會改變
(C)X 的係數估計值變成0.0108
(D)迴歸估計式的截距項變成 32.9

Y=95Z+32ˆY=0.5+0.006X95ˆZ+32=0.5+0.006XˆZ=(0.006X31.5)×59=1300X352ˆZ=1300X3523521300(A),(C),(D)R2XZ=(Cov(X,Z))2Var(X)Var(Z)=(Cov(X,59(Y32)))2Var(X)Var(59(Y32))=(59Cov(X,Y))2Var(X)(59)2Var(Y)=(Cov(X,Y))2Var(X)Var(Y)=R2XYR2(B)

26. 當移動平均數( Moving Average) 的方法用在一時間數列的時候, 下列敘述何者錯誤?
(A)此方法可以用來觀察時間數列的長期趨勢( secular trend)
(B)此方法可以移除時間數列的不規則變動( irregular variation)
(C)當移動期數變大時, 時間數列的波動會變小
(D)此方法可以移除時間數列的季節變動( seasonal variation)


(D)





2020t=10ˆy=98+6×10=1580.8158×0.8=126.4(A)

28. 下列的資料為某班級的考試分數, 分數的四分位距( interquartile range) 為何?
10, 31, 42, 46, 48, 55, 56, 58, 70, 75, 76, 77, 78, 80, 82, 83, 84
(A) 22  (B)32  (C)70  (D)77

12345678910111213141516171031424648555658707576777880828384{17×25%=4.2517×75%=12.75{Q1=5:48Q3=13:78=Q3Q1=30(B)



E(9X2)=9(1)2f(1)+902f(0)+912f(1)=9(f(1)+f(1))=18f(1)=18×49=8(D)

30. 假設手稿中的印刷錯誤數量是卜瓦松( Poisson) 分配, 某本 500 頁的手稿有 200 個印刷錯誤。 某頁完全沒有錯誤的機率為何?
(A)e0.4  (B)e0.4  (C)0.4  (D)0.6

P(X=k)=f(k;λ)=λkeλk!f(0,200500)=e25=e0.4(A)

31. 一個調查欲研究全國成人玩線上遊戲是否超過四分之三, 用了 400 個成人為全國代表性樣本, 調查發現有 320 個成人玩線上遊戲, 檢定統計量為何?
(A)1.1547  (B)2.3094 (C)2.50  (D)3.1254


z=ˆppp(1p)/n=320/4003/4(3/4)(1/4)/400=432.3094(B)

32. 某種統計認證的考試分數為常態分配, 平均數為 200 分, 母體標準差為 20 分。 隨機抽取 16 個分數取其平均, 這個平均分數大於 210 分的機率為何?
(A)0.9772  (B)0.6915  (C)0.3085  (D)0.0228

P(Z>21020020/16)=P(Z>2)=1P(Z2)=10.9772=0.0228(D)

33. 假設母體呈常態分配, 平均數μ未知。欲檢定H0:μ100 vs. Ha:μ>100 ,顯著水準設為 0.01。 若將型二錯誤( type II error) 控制為 5%。 當虛無假設H0為偽, 拒絕H0的機率為何?
(A)001  (B)0.05  (C)0.95  (D)0.99

H0H0=1=10.05=0.95(C)

34. 一個青少年研究, 調查 400 個男生及 400 個女生( 男生及女生為獨立樣本) , 欲探討過去一年中,他們是否曾向父母撒謊。 其中 240 個男生及 200 個女生曾向父母撒謊。 若檢定 H0 男生跟女生曾向父母撒謊的比例沒有差異, 結論為何?
(A)若顯著水準(α)為 0.10, 拒絕 H0; 若顯著水準(α)為 0.05, 則不拒絕H0
(B)若顯著水準(α)為 0.05, 拒絕 H0; 若顯著水準(α)為 0.025, 則不拒絕H0
(C)若顯著水準(α)為 0.025, 拒絕 H0; 若顯著水準(α)為 0.01, 則不拒絕H0
(D)若顯著水準(α)為 0.01, 拒絕 H0


{{n1=400^p1=240/400=3/5{n2=400^p2=200/400=1/2z=^p1^p2^p1(1^p1)n1+^p2(1^p2)n2=3/51/23/52/5400+1/21/2400=2072.857>2.325=z0.01H0(D)

35. 承上題, 如果以卡方檢定( Chi-square) 檢定性別與是否曾向父母撒謊有無關聯性, 其檢定統計量為何?
(A)8.08   (B)8.16  (C)400  (D)1,600


Oi:240200440160200360400400800p=240+200400+400=1120Ei:400×p=220400×p=220440400220=180400220=180360400400800χ2=(OiEi)2Ei=(240220)2220+(200220)2220+(160180)2180+(200180)2180=800220+8001808.08(A)

36. 一般科幻小說平均 290 頁。 某出版社隨機選擇他們出版的 16 部小說, 其平均長度為 335 頁, 標準差為 48 頁。 欲檢定這出版社的小說是否明顯比一般科幻小說長, 根據以上資料, 得出結論為:
(A)若顯著水準(\alpha)為 0.10, 拒絕 H_0; 若顯著水準(\alpha)為 0.05, 則不拒絕 H_0
(B)若顯著水準(\alpha)為 0.05, 拒絕 H_0; 若顯著水準(\alpha)為 0.025, 則不拒絕 H_0
(C)若顯著水準(\alpha)為 0.025, 拒絕 H_0; 若顯著水準(\alpha)為 0.01, 則不拒絕 H_0
(D)若顯著水準(\alpha)為 0.01, 拒絕 H_0


H_0:出版社的小說比一般科幻小說長\\檢定統計量t_{df=16-1}={335-290 \over 48/ \sqrt{16}} \Rightarrow t_{15}={15\over 4}=3.75\\查表知:3.75 > 3.733 (t_{df=15,\alpha=0.001}) \Rightarrow 拒絕H_0;\\也就是說無論\alpha=0.1,0.05,0.025,還是0.01,結果都是拒絕H_0,故選\bbox[red,2pt]{(D)}




由該表可知 \hat y=2.8x-1.2,將x=6代入可得\hat y=2.8\times 6-1.2=15.6\\,因此殘差為y-\hat y=14-15.6=-1.6,故選\bbox[red,2pt]{(B)} 註:本題的表格應該是EXCEL產生,其中標準誤所代表的涵意,請參考EXCEL的說明。

38. 一個資料中只有收入( 低、 中、 高) 及年齡群( 21 歲-30 歲、 31 歲-40 歲、 41 歲-50 歲、 51 歲-60 歲)兩個變數。 若要將收入、 年齡群及兩個變數的交互作用以虛擬變數放入迴歸模型當自變數, 會有幾個自變數?
(A) 7  (B) 9  (C) 11  (D) 12


3\times 4-1=11,故選\bbox[red,2pt]{(C)}

 

由題意知\cases{北區(x_i):\bar x=33, s_x^2=24,n_x=5\\ 中區(y_i):\bar y=29, s_y^2=17.5,n_y=5\\ 南區(z_i):\bar z=28, s_z^2 =9.5, n_z=5\\} \Rightarrow 總平均\bar{\bar x} ={n_x\bar x+ n_y\bar y+ n_z\bar z\over n_x+n_y+ n_z} \\={5(33 +29+28)\over 15}=30 \\ \Rightarrow SS_B= n_x(\bar x-\bar{\bar x})^2 +n_y(\bar y-\bar{\bar x})^2 +n_z(\bar z-\bar{\bar x})^2 =5((33-30)^2 + (29-30)^2 +(28-30)^2)\\ =5(9+1+4) = 5\times 14=70,故選\bbox[red,2pt]{(D)}

40. 假設過去的資料顯示 60%的大學生喜歡 C 牌的可樂, 隨機抽取 5 名學生至少有 1 名學生喜歡 C 牌可樂的機率為何?
(A)0.07776   (B)0.2   (C)0.92224  (D)0.98976


P(至少1名喜歡)=1-P(全部不喜歡)=1-(0.4)^5=0.98976,故選\bbox[red,2pt]{(D)}

解題僅供參考





沒有留言:

張貼留言