07 數據分析

More
3 年 11 個月 ago #613 來自 sgod
sgod created the topic: 07 數據分析
一維數據分析
1. 調查某新興工業都市的市民對市長施政的滿意情況,依據隨機抽樣,共抽樣男性600人、女性400人,由甲、乙兩組人分別調查男性與女性市民。調查結果男性中有36%滿意市長的施政,女性市民中有46%滿意市長的施政,則滿意市長施政的樣本佔全體樣本的百分比為__________%。
【90推甄】
2. 九十年度大學學科能力測驗有12萬名考生,各學科成績採用15級分,數學學科能力測驗成績分佈圖如下圖。請問有多少考生的數學成績級分高於11級分?選出最接近的數目。(1)...

一維數據分析


1. 調查某新興工業都市的市民對市長施政的滿意情況,依據隨機抽樣,共抽樣男性600人、女性400人,由甲、乙兩組人分別調查男性與女性市民。調查結果男性中有36%滿意市長的施政,女性市民中有46%滿意市長的施政,則滿意市長施政的樣本佔全體樣本的百分比為__________%。

【90推甄】


2. 九十年度大學學科能力測驗有12萬名考生,各學科成績採用15級分,數學學科能力測驗成績分佈圖如下圖。請問有多少考生的數學成績級分高於11級分?選出最接近的數目。
(1) 4000人
(2) 10000人
(3) 15000人
(4) 20000人
(5) 32000人。
【91學測補】

sa7 1


3. 下圖顯示民國88、89及90年三個年度所調查之臺灣北、中、南、東部地區國民對自己生活的滿意程度(資料來源:內政部統計處「國民生活狀況調查報告」)。

sa7 13

為比較各地區國民對自己生活滿意程度的差異,以東部地區國民之滿意度為基準,計算各年度中其他三地相對於當年度東部地區國民的「相對生活滿意度」。例如:88年度中部地區的相對生活滿意度為\(\frac{{74.6}}{{79.1}}\) 94.31%;89年度北部地區的相對生活滿意度為\(\frac{{73.3}}{{73.2}}\) 100.14%。下列關於各地區國民生活滿意度的敘述,何者正確?
(1) 北部地區國民的「相對生活滿意度」在88~90年三年中,以90年度為最低。
(2) 中部地區國民的「相對生活滿意度」在88~90年三年中逐年降低。
(3) 南部地區國民的「相對生活滿意度」在88~90年三年中,以90年度為最低。
(4) 在88~90年三年中,四地區國民間生活滿意度的差異在90年度達到最低。
(5) 在88~90年三年中,四地區國民間生活滿意度的差異逐年增加。

【91乙】


4. 抽樣調查某地區1000個有兩個小孩的家庭,得到如下數據,其中(男,女)代表第一個小孩是男孩而第二個小孩是女生的家庭,餘類推。

家庭別 家庭數
(男,男) 261
(男,女) 249
(女,男) 255
(女,女) 235


由此數據可估計該地區有兩個小孩家庭的男、女孩性別比約為__________:100
(四捨五入至整數位)。
【95學測】


5. 擲骰子100次,將其結果記錄如下:

點數 1 2 3 4 5 6
次數 10 25 20 20 10 15

 


若算術平均數為\(a\),中位數為\(b\),求\(a - b = \)__________。
【77社】


6. 有一群體有九位成員,其身高分別為(單位:公分)160,163,166,170,172,174,176,178,180,此九人的平均身高為171公分。今隨機抽樣3人,則抽到3人的平均身高等於母體平均身高的機率為__________。(化成最簡分數)
【91學測】


7. 某校想要了解全校同學是否知道中央政府五院院長的姓名,出了一份考卷。該卷共有五個單選題,滿分100分,每題答對得20分,答錯得零分,不倒扣。閱卷完畢後,校方公布每題的答對率如下:

題號
答對率 80 70 60 50 40

請問此次測驗全體受測同學的平均分數是
(1) 70分
(2) 65分
(3) 60分
(4) 55分 。
【91甲】


8. 某數學老師計算學期成績的公式如下:五次平時考中取較好的三次之平均值占30%,兩次期中考各占20%,期末考占30%。某生平時考成績分別為68,82,70,73,85,期中考成績分別為86,79,期末考成績為90,則該生學期成績為__________。(計算到整數為止,小數點以後四捨五入)

【93學測】


9. 根據台灣壽險業的資料,男性從0歲、1歲、…到60歲各年齡層的死亡率(單位:%)依序為
1.0250, 0.2350, 0.1520, 0.1010, 0.0720, 0.0590, 0.0550, 0.0540, 0.0540, 0.0520,
0.0490, 0.0470, 0.0490, 0.0560, 0.0759, 0.1029, 0.1394, 0.1890, 0.2034, 0.2123,
0.2164, 0.2166, 0.2137, 0.2085, 0.2019, 0.1948, 0.1882, 0.1830, 0.1799, 0.1793,
0.1813, 0.1862, 0.1941, 0.2051, 0.2190, 0.2354, 0.2539, 0.2742, 0.2961, 0.3202,
0.3472, 0.3779, 0.4129, 0.4527, 0.4962, 0.5420, 0.5886, 0.6346, 0.6791, 0.7239,
0.7711, 0.8229, 0.8817, 0.9493, 1.0268, 1.1148, 1.2139, 1.3250, 1.4485, 1.5851,
1.7353。
經初步整理後,已知61個資料中共有24個資料小於0.2。請問死亡率資料的中位數為下列哪一個選項?
(1) 0.2034
(2) 0.2164
(3) 0.2137
(4) 0.2085
(5) 0.2019。
【100學測】


10. 某生第一次月考六科的平均成績(算術平均)為80分。若已知其中五科的成績為68,80,80,80,86,則其成績的標準差為__________分。
(標準差公式:\(S = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{(\bar x - {x_i})}^2}} } \),\(\bar x = \frac{1}{n}\sum\limits_{i = 1}^n {{x_i}} \))
【86社】


11. 測量一物件的長度9次,得其長(公尺)為2.43,2.46,2.41,2.45,2.44,2.48,2.46,2.47,2.45。將上面數據每一個都乘以100,再減去240得一組新數據為3,6,1,5,4,8,6,7,5。問下列選項,何者為真?
(A) 新數據的算術平均數為5
(B) 新數據的標準差為2
(C) 原數據的算術平均數為2.45
(D) 原數據的標準差為0.2
(E) 原數據的中位數為2.45 。
【88推甄】


12. 某班數學老師算出學期成績後,鑑於學生平時都很用功,決定每人各加5分(加分後沒人超過100分),則加分前與加分後,學生成績統計數值絕對不會改變的有:
(A) 算數平均數
(B) 中位數
(C) 標準差
(D) 變異係數
(E) 全距。
(註:變異係數的定義為\(C.V. = \frac{s}{{\bar x}} \times 100\% \))
【88自】


13. 某班有48名學生,某次數學考試之成績,經計算得算術平均數為70分,標準差為\(S\)分。後來發現成績登錄有誤,某甲得80分,卻誤記為50分,某乙得70分,卻誤記為100分,更正後重算得標準差為\({S_1}\)分,試\({S_1}\)與\(S\)之間,有下列哪種大小關係?(\(n\)個數值\({x_1},\;{x_2},\; \cdots \;,\;{x_n}\)的標準差公式為\(S = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{({x_i} - \mathop x\limits^{\_\_} )}^2}} } = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{x_i}^2 - {{\mathop x\limits^{\_\_} }^2}} } \),而\(\mathop x\limits^{\_\_} = \frac{1}{n}\sum\limits_{i = 1}^n {{x_i}} \))
(A) \({S_1} < S - 5\)
(B) \(S - 5 \le {S_1} < S\)
(C) \({S_1} = S\)
(D) \(S < {S_1} \le S + 5\)
(E) \(S + 5 < {S_1}\)。
【89自】


14. 空氣品質會受到污染物排放量及大氣擴散等因素的影響。某一機構為瞭解一特定地區的空氣品質,連續二十八天蒐集了該地區早上的平均風速及空氣中某特定氧化物的最大濃度。再繪製這二十八筆資料的散布圖(見下圖),現根據該圖,可知
(1) 此筆資料中,該氧化物最大濃度的標準差大於15
(2) 此筆資料中,該氧化物最大濃度的中位數為15
(3) 此筆資料中,平均風速的中位數介於45與50間
(4) 若以最小平方法決定數據集中直線趨勢的直線,則該直線的斜率小於0。
【91甲】

sa7 2


15. 有一筆統計資料,共有11個數據如下(不完全依大小排列):
2,4,4,5,5,6,7,8,11,\(x\)和\(y\),
已知這些數據的算術平均數和中位數都是6,且\(x\)小於\(y\)。請選出正確的選項。
(1) \(x + y = 14\)
(2) \(y < 9\)
(3) \(y > 8\)
(4) 標準差至少是3。
【92甲】


16. SARS疫情期間,為了建立指標顯示疫情已受控制,以便向國人宣示可以過正常生活,有位公共衛生專家建議的指標是『連續7天,每天新增的可能病例都不超過(小於或等於)5人』。根據連續7天的新增病例計算,下列各選項,哪些必定符合此指標?
(1) 平均數\( \le 3\)
(2) 標準差\( \le 1\)
(3) 平均數\( \le 3\)且標準差\( \le 2\)
(4) 平均數\( \le 3\)且全距\( \le 2\)
(5) 眾數=1且全距\( \le 4\) 。
【92乙】


17. 某校高一第一次段考數學成績不太理想,多數同學成績偏低;考慮到可能是同學們適應不良所致,數學老師決定將每人的原始成績取平方根後再乘以10作為正式紀錄的成績。今隨機抽選100位同學,發現調整後的成績其平均為65分,標準差為15分;試問這100位同學未調整前的成績之平均\(M\)介於哪兩個連續正整數之間?(第7頁附有標準差公式)
(1) \(40 \le M < 41\)
(2) \(41 \le M < 42\)
(3) \(42 \le M < 43\)
(4) \(43 \le M < 44\)
(5) \(44 \le M < 45\) 。
【94學測】


18. 下列五個直方圖表示的資料,何者之標準差最大?【94乙】

(1)
sa7 3 1
(2)

sa 7 3 2
(3)

sa7 3 3
(4)

sa7 3 4
(5)

sa7 3 5

19. 定義一組資料的第一十分位數\({w_1}\)為『至少有(含)\(\frac{1}{{10}}\)的資料不大於\({w_1}\),且至少有(含)\(\frac{9}{{10}}\)的資料不小於\({w_1}\)』,試問下列敘述何者為真?
(1)任一組資料都恰有一個第一十分位數
(2)若將原資料每個數據分別乘以5,則原資料的第一十分位數乘以5也會是新資料的第一十分位數
(3) 若將原資料每個數據分別加5,則原資料的第一十分位數加5也是此新資料的第一十分位數
(4) 若有A,B兩組資料其第一十分位數分別為\({w_A}\),\({w_B}\),則\({w_A} + {w_B}\)也是此兩組資料合併成一組後的第一十分位數
(5) 任一組資料的第一十分位數必小於該組資料之算術平均數。
【94乙】


20. 某次數學測驗分為選擇題與非選擇題兩部分。下列的散佈圖中每個點\((\,X\;,\;Y\,)\)分別代表一位學生於此兩部分的得分,其中\(X\)表該生選擇題的得分,\(Y\)表該生非選擇題的得分。設
\(Z = X + Y\)
為各生在該測驗的總分。共有11位學生的得分數據。
試問以下哪些選項是正確的?
(1) \(X\)的中位數 > \(Y\)的中位數
(2) \(X\)的標準差 > \(Y\)的標準差
(3) \(X\)的全距 > \(Y\)的全距
(4) \(Z\)的中位數 = \(X\)的中位數 + \(Y\)的中位數 。

sa7 4

【95乙】

 

21. 根據一百多年來的氣象紀錄,美國費城年雨量平均值為41.0英吋,標準差為6.1英吋。今欲將此項統計資料的單位由英制換為公制,請問該城市一百多年來年雨量的標準差最接近下列的哪一個選項?(註:1英吋等於25.4毫米。)
(1) 0.240毫米
(2) 1.61毫米
(3) 6.10毫米
(4) 155毫米
(5) 1041 毫米 。
【97乙】


22. 某商店進一批水果,平均單價為每個50元,標準差為10元。今每個水果以進價的1.5倍為售價出售,則水果平均售價為每個__________元,標準差為__________元。
【99乙】


23. 所謂個人稅前所得,是指納稅義務人在納稅前之個人所得,以下簡稱所得。依照某國1997年的官方資料,依每人所得高低將人數等分為5組,最高20%的人的總所得占全體總所得的44.6%,而最低20%的人的總所得占全體總所得的3.6%,所有資料如下圖所示。所得差距倍數是指最高20%的個人平均所得與最低20%的個人平均所得的比值。請選出正確的選項。

(1) 此項資料顯示所得差距倍數超過13倍
(2) 最高30%的人的總所得超過全體總所得的55%
(3) 最少有60%的人,其個人所得低於全體平均所得
(4) 最低20%的人的平均所得為全體平均所得的3.6%。

sa7 5
【101乙】


24. 所謂某個年齡範圍的失業率,是指該年齡範圍的失業人數與勞動力人數之比,以百分數表達(進行統計分析時,所有年齡以整數表示)。下表為去年某國四個年齡範圍的失業率,其中的年齡範圍有所重疊。

年齡範圍 35~44 35~39 40~44 45~49
失業率 12.66(%) 9.80(%) 13.17(%) 7.08(%)


請根據上表選出正確的選項。
(1) 在上述四個年齡範圍中,以40~44歲的失業率為最高
(2) 40~44歲勞動力人數多於45~49歲勞動力人數
(3) 40~49歲的失業率等於\(\left( {\frac{{13.17 + 7.08}}{2}} \right)\% \)
(4) 35~39歲勞動力人數少於40~44歲勞動力人數
(5) 如果40~44歲的失業率降低,則45~49歲的失業率會升高。
【103學測】


25. 某班有41名學生,已知某次考試成績全班的平均分數為64,最高分為97,最低分為24。欲將全班學生成績做線性調整(調整後分數\( = a + b \times \)原始分數,其中\(b > 0\))使得最高分為100及最低分為50。請選出正確的選項。
(1) 調整後分數的平均值較原始分數的平均值低
(2) 調整後分數的中位數和原始分數的中位數一樣
(3) 調整後分數的中位數較原始分數的中位數高
(4) 調整後分數的標準差和原始分數的標準差一樣
(5) 調整後分數的標準差較原始分數的標準差大

【103乙】


26. 下面是甲、乙兩個商場的奇異果以及蘋果不同包裝的價格表,例如:甲商場奇異果價格「35元/一袋2顆」表示每一袋有2顆奇異果,價格35元。
甲商場售價

奇異果價格 20/一袋1 35/一袋2 80/一袋5 100/一袋6
蘋果價格 45/一袋1 130/一袋3 260/一袋6 340/一袋8


乙商場售價

奇異果價格 18/一袋1 50/一袋3 65/一袋4 95/一袋6
蘋果價格 50/一袋1 190/一袋4 280/一袋6 420/一袋10


依據上述數據,請選出正確的選項。
(1) 在甲商場買一袋3顆裝的蘋果所需金額低於買三袋1顆裝的蘋果
(2) 乙商場的奇異果售價,一袋裝越多顆者,其每顆單價越低
(3) 若只想買奇異果,則在甲商場花500元最多可以買到30顆奇異果
(4) 如果要買12顆奇異果和4顆蘋果,在甲商場所需最少金額低於在乙商場所需最少金額
(5) 無論要買多少顆蘋果,在甲商場所需最少金額都低於在乙商場所需最少金額
【105學測】


27. 一個41人的班級某次數學考試,每個人的成績都未超過59分。老師決定以下列方式調整成績:原始成績為\(x\)分的學生,新成績調整為\(40{\log _{10}}(\frac{{x + 1}}{{10}}) + 60\)分(四捨五入到整數)。請選出正確的選項。
(1) 若某人原始成績是9分,則新成績為60分
(2) 若某人原始成績超過20分,則其新成績超過70分
(3) 調整後全班成績的全距比原始成績的全距大
(4) 已知小文的原始成績恰等於全班原始成績的中位數,則小文的新成績仍然等於調整後全班成績的中位數
(5) 已知小美的原始成績恰等於全班原始成績的平均,則小美的新成績仍然等於調整後全班成績的平均(四捨五入到整數)
【105學測】
Ans:
1. 40
2. (2)
3. (3)
4. 105
5. 0.4
6. \(\frac{1}{{28}}\)
7. (3)
8. 84
9. (2)
10. 6
11. (A)(B)(C)(E)
12. (C)(E)
13. (B)
14. (3)(4)
15. (1)(2)
16. (4)(5)
17. (5)
18. (4)
19. (2)(3)
20. (1)(2)(3)
21. (4)
22. 75,15
23. (2)
24. (1)(4)
25. (3)
26. (1)(2)(4)
27. (1)(2)(4)



二維數據分析


1. 下圖為某年級國文、英文、歷史三科成績分布情形的直方圖。根據該圖,下列哪些推論是合理的?

sa7 6
(A) 歷史的平均分數比國文的平均分數低
(B) 歷史的平均分數最低
(C) 英文的標準差比國文的標準差小
(D) 英文的標準差最大
(E) 「國文與歷史之相關係數」比「國文與英文之相關係數」高。

【85推甄】


2. 下圖中,有五組數據,每組各有\(A\),\(B\),\(C\),\(D\),\(E\),\(F\)等六個資料點 設各組的相關係數由左至右分別為\({r_1}\),\({r_2}\),\({r_3}\),\({r_4}\),\({r_5}\),則下列關係式何者為真?
(A) \({r_1} = {r_2}\)
(B) \({r_2} < {r_3}\)
(3) \({r_3} > {r_4}\)
(4) \({r_3} < {r_5}\)
(5) \({r_4} = {r_5}\)。

sa7 7
【86推甄】


3. 有學生十人(甲、乙、…、癸),其期考數學成績與該學期數學課缺課,如下表如示:

學 生
缺課數 1 2 3 3 4 3 5 6 3 0
成 績 100 90 90 80 70 70 60 60 80 100

設兩者的相關係數為r,則
(A) \( - 1 \le r \le - 0.6\)
(B) \( - 0.6 < r < - 0.2\)
(C) \( - 0.2 \le r \le 0.2\)
(D) \(0.2 < r < 0.6\)
(E) \(0.6 \le r \le 1\) 。
【86自】


4. 右圖表兩組數據\(x\),\(y\)的分布圖,試問其相關係數\(r\)最接近下列何值?

sa7 8
(A) 1
(B) 0.5
(C) 0
(D) \( - 0.5\)
(E) \( - 1\)。
【88社】

5. 令\(X\)代表每個高中生平均每天研讀數學的時間(以小時計),則\(W = 7(24 - X)\)代表每個高中生平均每周花在研讀數學以外的時間。令\(Y\)代表每個高中生數學學科能力測驗的成績。設\(X\),\(Y\)之相關係數為\({R_{XY}}\),\(W\),\(Y\)之相關係數為\({R_{WY}}\),則\({R_{XY}}\)與\({R_{WY}}\)兩數之間的關係,下列選項何者為真?
(A) \({R_{WY}} = 7(24 - {R_{XY}})\)
(B) \({R_{WY}} = 7{R_{XY}}\)
(C) \({R_{WY}} = - 7{R_{XY}}\)
(D) \({R_{WY}} = {R_{XY}}\)
(E) \({R_{WY}} = - {R_{XY}}\) 。
【90推甄】


6. 某班的50名學生參加一項考試,考題共有100題,全為5選1的單選題。計分法共有\(X\)、\(Y\)兩種;若某學生有\(N\)題放棄沒答,\(R\)題答對,\(W\)題答錯,則\(X = R - \frac{W}{4}\),\(Y = R + \frac{N}{5}\)。試問下列敘述哪些是正確的?
(A) 同一學生的\(X\)分數不可能大於\(Y\)分數
(B) 全班\(X\)分數的算術平均數不可能大於\(Y\)分數的算術平均數
(C) 任兩學生\(X\)分數的差之絕對值不可能大於\(Y\)分數的差之絕對值
(D) 用\(X\)分數將全班排名次的結果與用\(Y\)分數排名次是完全相同的
(E) 兩種分數的相關係數為1 。
【90自】


7. 英國某實驗室研究一金屬圓柱(原高70.5英寸)在不同負重下對柱高的影響,其實驗結果如下:

\((\,0\;,\;70.5\,)\) \((\,2\;,\;69.4\,)\) \((\,4\;,\;68.4\,)\) \((\,6\;,\;67.2\,)\) \((\,8\;,\;66.3\,)\) \((\,10\;,\;65.5\,)\) \((\,12\;,\;64.4\,)\)


將此筆資料的相關係數記為\(r\),以最小平方法決定的直線斜率記為\(m\)。現為提供台灣廠商資料,將單位轉換為公噸(1英噸等於1.016公噸)及公分(1英寸等於2.54公分),若單位換算後該資料的相關係數記為\(R\),以最小平方法決定的直線斜率記為\(M\)。下列關係有哪些是正確的?
(1) \(r \cdot m > 0\)
(2) \(r > 0\)
(3) \(r = R\)
(4) \(m = M\)。
【93甲補】


8. 某校高三共有300位學生,數學科第一次段考、第二次段考成績分別以\(X\)、\(Y\)表示,且每位學生的成績用0至100評分。若這兩次段考數學科成績的相關係數為0.016,試問下列哪些選項是正確的?
(1) \(X\)與\(Y\)的相關情形可以用散布圖表示
(2) 這兩次段考的數學成績適合用直線\(X = a + bY\)表示\(X\)與\(Y\)的相關情形(\(a,\;b\)為常數,\(b \ne 0\))
(3) \(X + 5\)與\(Y + 5\)的相關係數仍為0.016
(4) \(10X\)與\(10Y\)的相關係數仍為0.016
(5) 若\(X' = \frac{{X - \overline X }}{{{S_X}}}\)、\(Y' = \frac{{Y - \overline Y }}{{{S_Y}}}\),其中\(\overline X \)、\(\overline Y \)分別為\(X\)、\(Y\)的平均數,\({S_X}\)、\({S_Y}\)分別為\(X\)、\(Y\)的標準差,則\(X'\)與\(Y'\)的相關係數仍為0.016 。

【96甲】


9. 某人進行一實驗來確定某運動之距離\(d\)與時間\(t\)的平方或立方成正比,所得數據如下:

sa7 9

為探索該運動的距離與時間之關係,令\(x = {\log _2}t\),\(y = {\log _2}d\),即將上述的數據\((\,t\;,\;d\,)\)分別取以2為底的對數變換,例如:\((\,2\;,\;53.65\,)\)變換後成為\((\,1\;,\;5.74\,)\)。已知變換後的數據\((\,{x_1}\;,\;{y_1}\,),\;(\,{x_2}\;,\;{y_2}\,),\; \cdots \;,\;(\,{x_9}\;,\;{y_9}\,)\)之散佈圖及以最小平方法所求得變數\(y\)對變數\(x\)的最適合直線(或稱迴歸直線)為\(y = a + bx\),如圖所示:

sa7 10
試問下列哪些選項是正確的?
(1) 若\(d = 14.88\),則\(3 < {\log _2}d < 4\)
(2) \(x\)與\(y\)的相關係數小於0.2
(3) 由上圖可以觀察出\(b > 2.5\)
(4) 由上圖可以觀察出\(a > 2\)
(5) 由上圖可以確定此運動之距離與時間的立方約略成正比 。
【97甲】

10. A,B,C,D是四組資料的散佈圖,如圖所示。利用最小平方法計算它們的迴歸直線,發現有兩組資料的迴歸直線相同,試問是哪兩組?

sa7 11 1sa7 11 2sa7 11 3sa7 11 4
(1) A、B
(2) A、C
(3) A、D
(4) B、C
(5) B、D。
【98乙】

11. 經濟學者分析某公司服務年資相近的員工之「年薪」與「就學年數」的資料,得到這樣的結論:『員工就學年數每增加一年,其年薪平均增加8萬5千元』。試問上述結論可直接從下列哪些選項中的統計量得到?
1) 「年薪」之眾數與「就學年數」之眾數
(2) 「年薪」之全距與「就學年數」之全距
(3) 「年薪」之平均數與「就學年數」之平均數
(4) 「年薪」與「就學年數」之相關係數
(5) 「年薪」對「就學年數」之迴歸直線斜率。
【98乙】


12. 調查某國家某一年5個地區的香煙與肺癌之相關性,所得到的數據為\((\,{x_i}\;,\;{y_i}\,)\),\(i = 1,\;2,\;3,\;4,\;5\),其中變數\(X\)表示每人每年香煙消費量(單位:十包),\(Y\)表示每十萬人死於肺癌的人數。若已計算出下列數值:
\(\begin{array}{l}\sum\limits_{i = 1}^5 {{x_i}} = 135\;,\quad \quad \sum\limits_{i = 1}^5 {{x_i}^2} = 3661\;,\quad \quad \sum\limits_{i = 1}^5 {{x_i}} {y_i} = 2842\;,\\\sum\limits_{i = 1}^5 {{y_i}} = 105\;,\quad \quad \sum\limits_{i = 1}^5 {{y_i}^2} = 2209\;,\end{array}\)
則\(X\)與\(Y\)的相關係數\(r = \)__________。
【99乙】
(參考說明:相關係數\(r = \frac{{\sum\limits_{i = 1}^n {({x_i} - \bar x)({y_i} - \bar y)} }}{{\sqrt {\sum\limits_{i = 1}^n {{{({x_i} - \bar x)}^2}} } \cdot \sqrt {\sum\limits_{i = 1}^n {{{({y_i} - \bar y)}^2}} } }} = \frac{{\sum\limits_{i = 1}^n {{x_i}{y_i} - n \cdot \bar x \cdot \bar y} }}{{\sqrt {\sum\limits_{i = 1}^n {{x_i}^2 - n \cdot {{\bar x}^2}} } \cdot \sqrt {\sum\limits_{i = 1}^n {{y_i}^2 - n \cdot {{\bar y}^2}} } }}\))


13. 已知以下各選項資料的迴歸直線(最適合直線)皆相同且皆為負相關,請選出相關係數最小的選項。
(1)

x 2 3 5
y 1 13 1

(2)

x 2 3 5
y 3 10 2


(3)

x 2 3 5
y 5 7 3


(4)

x 2 3 5
y 9 1 5


(5)

x 2 3 5
y 7 4 4

【102學測】

14. 某研究所處理個人申請入學,其甄選總成績係採計測驗A分數及測驗B分數各占50%。50位申請同學依甄選總成績高低排序,錄取前20名。現依准考證號碼順序,將這些同學的成績列表如下:(例如,第一位同學的測驗A分數及測驗B分數分別為93分及28分)

測驗A 93 98 100 100 100 98 96 96 98 96 96 98 98
測驗B 28 50 59 22 52 67 30 15 46 11 72 21 59
測驗A 93 100 100 100 100 98 98 96 98 100 96 100 96
測驗B 24 13 53 33 61 57 55 26 35 40 9 60 23
測驗A 96 96 96 100 100 96 98 98 91 100 96 100 98
測驗B 66 29 34 58 55 35 16 28 28 72 51 39 40
測驗A 98 96 96 93 98 96 98 98 98 98 93    
測驗B 18 43 8 38 32 53 38 53 30 54 72    


所有學生測驗A分數的平均數為97.38,而測驗B分數的平均數為40.22。現從甄選總成績、測驗A分數及測驗B分數之中任選兩種成績作散佈圖,圖甲及圖乙為其中之二;兩圖中各有50個資料點,每一點代表一位同學;兩個橫軸與縱軸之單位長可能皆不相同。請選出正確的選項。

sa7 12
(1) 圖乙的橫軸為測驗A分數
(2) 圖乙的縱軸為甄選總成績
(3) 圖甲的橫軸為甄選總成績
(4) 若只以測驗B分數高低錄取20位同學(不採計測驗A分數),錄取的同學與以甄選總成績高低錄取的同學完全相同
(5) 甄選總成績的平均數為97.38及40.22的平均數。

【102乙】


15. 小明參加某次路跑10公里組的比賽,下表爲小明手錶所記錄之各公里的完成時間、平均心率及步數:

  完成時間 平均心律 步數
第一公里 5:00 161 990
第二公里 4:50 162 1000
第三公里 4:50 165 1005
第四公里 4:55 162 995
第五公里 4:40 171 1015
第六公里 4:41 170 1005
第七公里 4:35 173 1050
第八公里 4:35 181 1050
第九公里 4:40 171 1050
第十公里 4:34 188 1100


在這10公里的比賽過程,請依據上述數據,選出正確的選項。
(1) 由每公里的平均心率得知小明最高心率爲188
(2) 小明此次路跑,每步距離的平均小於1公尺
(3) 每公里完成時間和每公里平均心率的相關係數爲正相關
(4) 每公里步數和每公里平均心率的相關係數爲正相關
(5) 每公里完成時間和每公里步數的相關係數爲負相關
【104學測】
16. 下表是某國在2009 年至2015 年間, 運動選手的人數統計:

年份 男生 女生
2009 3410 1950
2010 3420 2000
2011 3540 2240
2012 3710 2370
2013 3830 2650
2014 3920 2780
2015 3990 2860


關於該國運動選手, 請根據這張表選出正確的敘述。
(1) 從2009年到2015年,男運動選手增加的總人數比女運動選手增加的總人數多
(2) 從2009年到2015年,平均一年增加了580名男運動選手
(3) 從2009年到2015年,男女運動選手人數差距逐年持續縮小
(4) 如果分別計算男女運動選手人數對年份的迴歸直線(最適直線),則男生的直線斜率小於女生的直線斜率
(5) 在2009年到2015年共7年中, 全國平均一年有超過6000名運動選手
【104乙】

Ans:
1. (A)(B)(D)
2. (A)(B)(E)
3. (A)
4. (C)
5. (E)
6. (A)(B)(D)(E)
7. (1)(3)
8. (1)(3)(4)(5)
9. (1)(4)
10. (4)
11. (5)
12. 875
13. (5)
14. (1)(2)(4)(5)
15. (2)(4)(5)
16. (4)(5)


Love is like π - natural, irrational, and VERY important.

-Lisa Hoffman

Please 登入新增帳號 to join the conversation.

More
3 年 11 個月 ago #614 來自 sgod
sgod replied the topic: 07 數據分析
關於數據分析的問題可以在這快速回覆或者到討論區中的「中學數學」版中討論

Love is like π - natural, irrational, and VERY important.

-Lisa Hoffman

Please 登入新增帳號 to join the conversation.

建立頁面時間:0.087 秒