107年特種考試地方政府公務人員考試
等別:五等考試
類科 :統計
科目:統計學大意
類科 :統計
科目:統計學大意
1.為了要決定某藥對疾病之醫療效果,對 23 位病人施予投藥,而對另外 23 位病人給予安慰劑。前述蒐集資料的方式,稱為:
(A) 觀察研究 (B) 實驗設計 (C) 模擬 (D) 調查
該方式區分實驗與對照,並經設計後施行,故選(B)
(A) 用錯誤資料所得的中位數不是正確的
(B) 用錯誤資料所得的四分位距( interquartile range)不是正確的
(C) 正確的變異數應比用錯誤資料所得變異數小
(D) 正確的變異係數(coefficient of variation)應比用錯誤資料所得的變異係數大
解:
原資料範圍為−90至190,錯誤資料範圍為−99至199,即正確的資料範圍較小,故選(C)
解:{樣本平均數ˉx=∑xi/n=320/10=32樣本標準差sx=√∑(xi−ˉx)2(n−1)=√∑x2i−(∑xi)2/nn−1=√10434−3202/109=√1943=4.64{樣本平均數ˉy=∑yi/n=320/10=32樣本標準差sy=√∑y2i−(∑yi)2/nn−1=√10270−3202/109=√303=1.83⇒(32,4.64);(32,1.83),故選(C)
(A) 當一組資料均為正偏時,平均數≦ 眾數≦ 中位數
(B) 若一組資料的平均數、眾數、中位數皆相等時,則變異數不為零
(C) 當一組資料均為負偏時,平均數≦ 中位數≦ 眾數
(D) 若一組資料的眾數、中位數及平均數愈大,則其全距也會愈大
解:
負偏態:高峰在右,即平均數≦ 中位數≦ 眾數;
正偏態:高峰在左,即眾數≦ 中位數≦ 平均數;
正態:高峰在中間,即眾數= 中位數= 平均數;
故選(C)
(A) 一致分配 (B) t 分配 (C) 指數分配 (D) 常態分配
解:依中央極限定理(de Moivre - Laplace)二項分布的極限為常態分布,故選(D)
(A) 約有 95%資料落在 8 至 32 之間
(B) 約有 95%資料落在 52 至 92 之間
(C) 至少有 75%資料落在 11 至 29 之間
(D) 至少有 75%資料落在 8 至 32 之間
解:
該資料並非常態分布,僅能以柴比雪夫不等式來推估即P(|X−μ|<kσ)≥1−1k2⇒P(|X−20|<2×6)≥1−122⇒P(8<X<32)≥34=75%,故選(D)
7. 下列何種方法非用來檢測資料是否來自近似常態分配?
(A) 計算 x ± s , x ± 2s ,及 x ± 3s 區間,落在各區間測量值百分比約各是 68%, 95%,與 99.7%
(B) 建構直方圖或莖葉圖,圖形應是一致(均勻)分配
(C) 求樣本內四分位距(IQR)與標準差(S),則 IQR / S ≈ 1.35
(D) 建立常態機率圖,資料點應大約落在一直線上
解:均勻分配並非常態分配,故選(B)
(A) 0.2228 (B) 0.2229 (C) 0.2230 (D) 0.2231
解:
10 天會收到三個訂單,平均每天會收到λ=3/10個訂單;
至少 5 天之久,才會有下個訂單,代表連續五天都沒有訂單;
由卜松分配可知: P(X=x)=e−λλx/x!⇒P(X=0)=e−λ;
五天都沒有訂單的機率:P5(X=0)=e−5λ=e−3/2=0.2231(查試題附表),故選(D)。
至少 5 天之久,才會有下個訂單,代表連續五天都沒有訂單;
由卜松分配可知: P(X=x)=e−λλx/x!⇒P(X=0)=e−λ;
五天都沒有訂單的機率:P5(X=0)=e−5λ=e−3/2=0.2231(查試題附表),故選(D)。
(A) 不成對 t 檢定,拒絕上課無法增加信用分數
(B) 成對 t 檢定,拒絕上課無法增加信用分數
(C) 不成對 t 檢定,無法拒絕上課無法增加信用分數
(D) 成對 t 檢定,無法拒絕上課無法增加信用分數
解:
由於檢定統計值>上臨界值,因此拒絕H0:上課前後分數相等,故選(B)
(A) 介於 0.05 及 0.1 之間 (B) 介於 0.025 及 0.05 之間
(C) 介於 0.01 及 0.025 之間 (D) 介於 0.005 及 0.01 之間
解:
P(X>27)=P(T>27−253/√15)=P(T>2.582)查試題附表可知:{t0.025(14)=2.1448t0.01(14)=2.6245⇒t0.025(14)<2.582<t0.01(14)⇒0.01<P(T>2.582)<0.025,故選(C)
(A) 0.985 (B) 0.965 (C) 0.945 (D) 0.895
解:由(n−1)s2σ2∼χ2(n−1)推估:P(9.81<s2<90.405)=P((9−1)×9.8136<(9−1)×s236<(9−1)×90.40536)=P(2.18<χ2<20.09)查試題附表(自由度=9−1=8)可得{P(χ2>20.0902)=0.01P(χ2>2.1797)=0.975⇒P(2.18<χ2<20.09)=0.975−0.01=0.965,故選(B)(A) 迴歸解釋的標準差占總標準差的比例;相關係數的平方等於判定係數
(B) 迴歸解釋的變異占總變異的比例;相關係數的平方等於判定係數
(C) 迴歸解釋的標準差占總標準差的比例;相關係數開根號等於判定係數
(D) 迴歸解釋的變異占總變異的比例;相關係數開根號等於判定係數
解:由定義可知:{判定係數R2=(Cov(X,y))2Var(X)Var(Y)相關係數γ=Cov(X,y)√Var(X)√Var(Y)⇒γ2=R2,故選(B)
(A) S/N (B) 2S/n-1 (C) (N+1)/2 (D) S(S+1)/2
解:{母體平圴數μ=(1+2+⋯+N)÷N=(N+1)/2樣本平均數¯X=S/n⇒由¯X推估μ,即Sn=N+12⇒N=2Sn−1,故選(B)
(A) 19 元 (B) 95 元 (C) 20 元 (D) 92 元
解:點數相同的樣本空間S={(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}⇒P(S)=636=16假設每次玩此遊戲需付x元,則期望值為95×16−x×56=0⇒x=955=19,故選(A)
(A) 0.0384 (B) 0.1321 (C) 0.0128 (D) 0.0012
解:t=14.3−141.2/√50−1=74=1.75查試題附表可得{t50,0.05=1.6759t50,0.025=2.0086⇒0.025<P(t>1.75)<0.05,故選(A)註:試題未附Z表,且t表僅有n=50,沒有n=49,僅能推估;
(A) (0.722, 0.878);無法 (B) (0.762, 0.838);可以
(C) (78.04%, 81.96%);無法 (D) (62.469%, 97.531%);可以
解:95%信賴區間為ˉp±zα/2×√ˉp(1−ˉp)n=0.8±1.96×√0.8(1−0.8)100=0.8±0.0784=(0.8−0.0784,0.8+0.0784)=(0.7216,0.8784);又0.9不在該區間內,故選(A)
(A) (0.837, 3.663);不相等 (B) (0.847, 3.753);相等
(C) (0.867, 3.843);不相等 (D) (0.887, 3.820);相等
解:
題目有疑義,故(送分)
(A) 約 70% (B) 約 85% (C) 約 55% (D) 約 95%
解:A地區檢測到此土壤存在的機率PA=0.5×0.7+0.2×0.9+0.3×0.3=0.62A地區檢測到此土壤存在且位於油田的機率PB=0.5×0.7+0.2×0.9=0.53挖到油的機率為PB/PA=0.53/0.62=0.8548≈85%,故選(B)
(A) 0.1847 (B) 0.1991 (C) 0.5438 (D) 0.6472
解:P(X≥5)=1−P(X≤4)=1−4∑k=0P(X=k)=1−0.8153(查試題附表,λ=3)=0.1847,故選(A)註: 一般「超過五次」應該是P(X>5)=P(X≥6),若依此則無答案可選!!
(A) 0.5 年 (B) 1 年 (C) 1.5 年 (D) 2 年
解:P(X≤x)=2.5%⇒P(Z≤x−μσ)=P(Z≤x−31)=2.5%=0.025由z2=0.975⇒z−2=1−0.975=2.5%⇒x−31=−2⇒x=1,故選(B)解:
sourceDFSSMSSFtreatment4−1=311700−10800=900900÷3=300300÷300=1error39−3=36300×36=10800300total10×4−1=3911700,故選(D)
(A) 如果0 ≤ x ≤ 10,則 0 ≤ f (x)≤1, 0 ≤ g(x)≤ 1
(B) 如果 X 與 Y 是不相關( uncorrelated),則 X 與 Y 彼此獨立
(C) P(X=3)=f (3)
(D) P(-5 ≤ Y ≤ 0)=g (0)
解:(A)×:0≤x=3.6≤10⇒f(3.6)不存在(B)×:不一定(C)◯:f(x)為離散型⇒P(X=3)=f(3)(D)×:g(y)為連續型,無個別機率值g(0),故選(C)註: 題目g(x)應為g(y)
解:{yi=1+(β−2)xi+εi^yi=1+(β−2)xi⇒εi=yi−ˆyi=yi−1−(β−2)xi令g(β)=∑ε2i=∑(yi−1−(β−2)xi)2=∑(yi−1−βxi+2xi)2⇒g′(β)=0⇒2∑((yi−1−βxi+2xi)(−xi))=2∑(−xiyi+xi+βx2i−2x2i)=0⇒∑βx2i=∑(xiyi−xi+2x2i)⇒β=∑xiyi−∑xi+2∑x2i∑x2i=10−5+2×1515=3515=73,故選(A)
(A) 如果假設為 H0:μ=6 對 H1:μ≠6,則在 5%的顯著水準下,結論是不拒絕虛無假設H0
(B) 如果假設為 H0:μ=7 對 H1:μ≠7 ,則 t 統計量值為 10
(C) 如果假設為 H0:μ=10 對 H1:μ≠10 ,則 p 值( p-value)為 1
(D) 如果樣本數增加至 16,且這 16 個零件長度的標準差亦為 2 公分,則樣本數 16 所得 μ之 95%信賴區間寬度為原來樣本數 4 所得 μ之 95%信賴區間寬度的一半
解:
95%的信賴區間為[6.818,13.182]=[ˉx−1.96s,ˉx+1.96s]⇒{ˉx=10s=2(C)H0:μ=10⇒μ=ˉx,落在信賴區間的中心⇒p=1,故選(C)
解:
ˆyi=β0+β1xi⇒β1=sxysxx=∑(xi−ˉxi)(yi−ˉyi)∑(xi−ˉxi)2=2010=2⇒β0=ˉy−β1ˉx=ˉy−2ˉx⇒∑(ˆyi−ˉy)2=∑(β0+β1xi−ˉy)2=∑(ˉy−2ˉx+2xi−ˉy)2=∑(2(xi−ˉx))2=4∑(xi−ˉx)2=4×10=40因此我們有以下ANOVA表格:sourceDFSSMSSFregression1∑(ˆyi−ˉy)2=404040÷20=2error6−1=5∑(yi−ˉy)2=140−40=100100÷5=20total7−1=6∑(yi−ˉy)2=140,故選(C)
(A) 約 42% (B) 約 83% (C) 約 92% (D) 約 21%
解:假設10件商品的編號為1,2,…,10,其中編號1,2,3的商品有附加贈品;
將10件商品排列,前5件商品給甲,後5件商品給乙,總排列數為10!;
前5件沒有編號1,2,3的可能排列數為P75,而每一個排列出現5!次,因此甲至少拿到1件贈品的機率為1−P75×5!10!=1−7!×5!2×10!=1−112=0.917,故選(C)
解:t∗i=95t+32⇒{¯t∗=95¯t+32s2t∗=8125s2tst∗=95st(A)×:t∗i的變異係數=st∗¯t∗=95st95¯t+32≠st¯t=ti的變異係數(B)×:s2t∗=8125s2t(C)×:Sxt∗=Cov(X,T∗)=Cov(X,95T+32)=95Cov(X,T)+Cov(X,32)=95Cov(X,T)=95Sxts2t=95Sxt(D)◯:t∗1的Z分數=t∗1−¯t∗st∗=(95t1+32)−(95¯t+32)95st=95(t1−¯t)95st=t1−¯tst=t1的Z分數,故選(D)
解:
(C)◯:{s2X=19∑10i=1(xi−ˉx)2s2Y=19∑10i=1(yi−ˉy)2⇒母體變異數σ2的估計量為s2X+s2Y2=118(10∑i=1(xi−ˉx)2+10∑i=1(yi−ˉy)2),故選(C)
(A) 如果 n 是偶數,則 Y 的期望值( expected value)不為 0
(B) 如果 n 是奇數,則 Y 的期望值不為 0
(C) 如果 n 是奇數,則 Y 的變異數為 1
(D) X 與 Y 是正相關( positively correlated),即 X 與 Y 的共變異數( covariance)是正的
解:
X∼B(n,k)⇒P(X=k)=(nk)pk(1−p)n−k=(nk)12n(∵
(A) α+β=1
(B) 一般常用的 t 檢定,其 β 的值與顯著水準無關;即當顯著水準改變時, β 的值還是不變
(C) 如果型 II 錯誤是一新型引擎比舊型引擎效能好,但被誤判為並沒有比較好,則虛無假設為新型引擎比舊型引擎效能好
(D) 若兩檢定方法 A 與 B 其型 I 錯誤發生的機率皆在顯著水準之內,但檢定方法 A 其型 II 錯誤發生的機率較低,則其檢定力( power of test)較高
解:
只有(D)正確, 故選\bbox[red,2pt]{(D)}
解:(B)\times:\beta_1\sim N(1,1) \Rightarrow P(|Z|\le 1.645)=0.9(查表z_{-1.645}=0.05) \\\Rightarrow 信賴區間=[\beta_1-1.645\times 1, \beta_1+ 1.645\times 1]=[-0.645,2.645],故選\bbox[red,2pt]{(B)}
解:Y=\beta_0+\beta_1 X+\varepsilon \Rightarrow \text{Cov}(X,Y)= \text{Cov}(X,\beta_0+\beta_1 X+\varepsilon) \\= \beta_0\text{Cov}(X,1) +\beta_1\text{Cov}(X,X) +\text{Cov}(X,\varepsilon) =0+\beta_1 Var(X)+0 \Rightarrow\text{Cov}(X,Y)= \beta_1 Var(X) \\ 又相關係數\gamma= \frac{\text{Cov}(X,Y)}{\sqrt{Var(X)}\sqrt{Var(Y)}}= \frac{\beta_1 Var(X)}{\sqrt{Var(X)}\sqrt{Var(Y)}} = \frac{\beta_1 \sqrt{Var(X)}}{ \sqrt{Var(Y)}} \\ \Rightarrow \frac{ \sqrt{Var(X)}}{ \sqrt{Var(Y)}} =\frac{\gamma}{\beta_1}=\frac{ -0.8}{-1.6}=\frac{1}{2} \Rightarrow \sigma_Y=2\sigma_X,故選\bbox[red,2pt]{(D)}
解:(A)\times: x=95 \Rightarrow z={95-80 \over 6}=2.5<3 \Rightarrow 不是離群值\\(B)\bigcirc: x=95 \Rightarrow z={95-82\over 2}=6.5>3 \Rightarrow 95在亞太是離群值,符合晉升標準\\(C) \times: P(52<x<88)= P\left({52-70\over 3}<z < {88-70 \over 3}\right) = P(-6<z<6) >> 95\% \\(D)\times: \begin{cases} 美洲CV={\sqrt{12.25} \over 85} = 0.041 \\ 歐洲CV={\sqrt{9} \over 70} = 0.043\end{cases} \Rightarrow 美洲CV < 歐洲CV\\,故選\bbox[red,2pt]{(B)}
解:X\sim B(3, p=1/2) \Rightarrow P(X=k)= {3\choose k}{1\over 2^k}\cdot {1\over 2^{3-k}}= {3\choose k}{1\over 8} \\\Rightarrow 期望值 E_k= 800\times P(X=k) =100\times {3\choose k},k=0,1,2,3;\\ \Rightarrow \begin{array}{}\hline i& 0 & 1 & 2 & 3\\\hline 觀察值 O_i & 50 & 300 & 400 & 50\\ \hline 期望值E_i & 100\times {3\choose 0}=100 & 100\times {3\choose 1}=300 & 100\times {3\choose 2}=300 & 100\times {3\choose 3}=100 \\\hline\end{array}\\ \Rightarrow 卡方檢定統計量值為 \sum_{i=0}^3{(O_i-E_i)^2\over E_i}\\= {(50-100)^2\over 100} +{(300-300)^2\over 300} +{(400-300)^2\over 300} +{(50-100)^2\over 100} =25+0+{100\over 3} +25= {250\over 3}\\,故選\bbox[red,2pt]{(C)}
解:P(|\overline{X}-\mu|\le 20)=0.95 \Rightarrow P(-20\le \overline{X}-\mu\le 20)=0.95 \Rightarrow P(-\frac{20}{\sigma/\sqrt{n}}\le \frac{\overline{X}-\mu}{\sigma/\sqrt{n}}\le \frac{20}{\sigma/\sqrt{n}}) \\ = P(-\frac{20}{200/\sqrt{n}}\le Z\le \frac{20} {200/\sqrt{n}})=P(-\frac{\sqrt{n}}{10}\le Z\le \frac{\sqrt{n}} {10}) =0.95 \\ \Rightarrow \frac{\sqrt{n}} {10}=1.96 \Rightarrow n=19.6^2=384.16,故選\bbox[red, 2pt]{(C)}註:試題未附Z表,可改查T表,t_{400,0.025}\approx 1.96!!
解:(A)\times:\sum f(x)=1 \Rightarrow \frac{k^2-8k+8}{4} +\frac{k}{2}+\frac{1}{4} = \frac{k^2-6k+9}{4}=1 \Rightarrow k^2-6k+5=0 \\\quad \Rightarrow k=1(\because \frac{k}{2}<1, k=5不合) \\(B)\times: P(20\le X<30)= P(20) = \frac{k}{2} \ne \frac{2k+1}{4}\\(C)\bigcirc: \sum xP(X=k)= 10\times \frac{k^2-8k+8}{4} +20\times \frac{k}{2}+30\times \frac{1}{4} = 10\times \frac{1}{4} +20\times \frac{1}{2}+30\times \frac{1}{4} =20\\(D)\times: P(-10< X <10)=0 \\故選\bbox[red,2pt]{(C)}
解:(A)\times:P((B_1\cup B_2)\cap A_1)=\frac{50+100}{300}=\frac{150}{300} \neq \frac{150}{200}\\(B)\bigcirc: \begin{cases}P(A_2)=\frac{10+50+40}{300}=\frac{1}{3}\\ P(B_2)= \frac{100+50}{300} =\frac{1}{2}\end{cases} \Rightarrow P(A_2\cap B_2)=\frac{50}{300} =\frac{1}{6}=P(A_2)\times P(B_2)\\(C)\times:P(A_2\cup B_2)=(10+50+40+100)/300=\frac{2}{3}\neq \frac{5}{6}\\(D)\times:P(B_1\mid A_1)=P(B_1\cap A_1)/P(A_1)=50/(50+100+50)=\frac{1}{4}\ne \frac{1}{6}\\,故選\bbox[red, 2pt]{(B)}
解:總平均\bar {\bar x}=\frac{6\times( \bar x+\bar y +\bar z)}{18}= \frac{6(70+60+80)}{18}= 70 \\\Rightarrow SST = \sum_{i=1}^6(x_i-\bar{\bar x})^2 +\sum_{i=1}^6(y_i-\bar{\bar x})^2 +\sum_{i=1}^6(z_i-\bar{\bar x})^2 \\=\sum_{i=1}^6 x_i^2 +\sum_{i=1}^6 y_i^2 +\sum_{i=1}^6 z_i^2 -140\left(\sum_{i=1}^6 x_i +\sum_{i=1}^6 y_i +\sum_{i=1}^6 z_i \right)+3\sum_{i=1}^6\bar{\bar x}^2\\ =29900+22100+38900 -140(6\times 70+ 6\times 60+ 6\times 80)+3\times 6\times 70^2=2700\\ SSW=\sum_{i=1}^6(x_i-\bar x)^2 +\sum_{i=1}^6(y_i-\bar y)^2 +\sum_{i=1}^6(z_i-\bar z)^2 \\=\sum_{i=1}^6 x_i^2-(\sum_{i=1}^6 x_i)^2/6 + \sum_{i=1}^6 y_i^2-(\sum_{i=1}^6 y_i)^2/6 + \sum_{i=1}^6 z_i^2-(\sum_{i=1}^6 z_i)^2/6 \\ =29900-420^2/6 + 22100-360^2/6+ 38900-480^2/6= 1500\\ \Rightarrow SSB = SST-SSW = 2700-1500=1200\\ 因此有以下ANOVA 表格: \\\begin{array}{}\hline source & SS & DF & MS & F\\\hline 組間 & 2700-1500=1200 & 3-1=2& 1200\div 2=\color{blue}{600} & 600\div 100=6\\ 組內 & 1500 & 17-2=15& 1500\div 15=100 \\ 總和 & 2700 & 18-1=17& \\\hline \end{array}\\ 由以上表格可知,只有(A)正確,即MSSB=1200\div 2=600 ,故選\bbox[red,2pt]{(A)}
解:(B)\times: 有限母體\bar P的變異數應為{N-n\over N-1}\times {p(1-p) \over n},故選\bbox[red,2pt]{(B)}
解:
(A)\times:\begin{cases} 第1份問卷支持率p_1=90/400 =9/40 \\ 第2份問卷支持率p_2= 360/1600 =9/40\end{cases}\Rightarrow p_1=p_2=p \\\Rightarrow \begin{cases} 標準差\sigma_1= \sqrt{p(1-p)\over n_1} = \sqrt{p(1-p)\over 400} ={ \sqrt{p(1-p)}\over 20}\\標準差\sigma_2= \sqrt{p(1-p)\over n_2} = \sqrt{p(1-p)\over 1600} ={ \sqrt{p(1-p)}\over 40}\end{cases}\\ \Rightarrow \sigma_1 = 2\sigma_2 \Rightarrow 第1份問卷的信賴區間是第2份的兩倍\\(B)\times: 兩份問卷支持率相同,但標準差不同,所以p-\text{value }也不同\\(C)\times: z_{0.95} > z_{0.9} \Rightarrow 95\% 信賴區間> 90\%信賴區間\\(D)\bigcirc: \begin{cases}第1份問卷z_A={9/40-0.2 \over \sqrt{9/40(1-9/40) \over 400}}=1.197\\ 第2份問卷z_B={9/40-0.2 \over \sqrt{9/40(1-9/40) \over 1600}}= 2.395 \\ z_{0.025}=1.96\end{cases} \Rightarrow z_B > z_{0.025} > z_A\\,故選\bbox[red,2pt]{(D)}
沒有留言:
張貼留言