【統計學 Statistics】眾數|中位數|平均數|分佈域|四分位數

AfterSchool
AfterSchool 2024-3-15 235
統計學 Statistics 係數學DSE嘅必修課題,重點技巧包括Mode 眾數、Median 中位數、Mean 平均數、Range 分佈域、Interquartile Range 四分位數等。
相信大家都記得以前學過有關「統計圖」嘅課題,而統計學 Statistics 就係從統計數據之中理解當前趨勢嘅課題,就例如了解眾數、中位數、平均數、分佈域、四分位數,從而去做一啲推斷或者決定。
AfterSchool為大家介紹所有公式定理及應用,並附上相關題目示範!
喺學習零散嘅新知識之前,有冇諗過需要先建立一個系統性嘅學習模式?我係Kingsley,多年來透過DSE數學補習幫助學生輕鬆取得大學入場券。想知道我嘅教學理念同往績,即撳:數學補習名師 Kingsley | AfterSchool

1. 平均值 Mean

平均值(Mean)常用於表示統計對象嘅一般水平(average value),算式為「所有項數的數值÷所有項數的數目」,例如最近7日平均溫度、全班女同學平均身高、10個橙嘅平均重量等等。 
誤用情況:數據有太離散的項值,例如3個啞鈴分別為1、2及60公斤,於是乎平均值為「(1+2+60)÷3=21公斤」,然而因為受到極端值的影響,得出的結果其實是毫無意義或無法反映現實分布。

2. 眾數 Mode

眾數(Mode)= 頻數最高的數據(appear most one),指一組數據中出現次數最多嘅數據值,例如「4、5、5、6、6、6、6、7、7」中,出現最多嘅係6,因此眾數為6。
眾數可以係一個數(例如 6),亦可以係多個數(例如上例無咗6嘅話,5與7各出現兩次,因此眾數為5及7);然而若數據嘅數據值出現次數相同且無其他數據值時,則不存在眾數,例如「2、2、5、5、8、8」中,2、5、8出現次數相同且沒有其他數,因此此數據不存在眾數。

3. 中位數 Median

中位數(Median)= 由小至大排列後位於中間的數據(middle one after queued),意思即指一組數據經排列後劃分爲數量相等嘅上下兩部分,中間未被分組的數則為中位數(例如1、4、5、7、8的中位數為5);如果數據為偶數,則中位數取最中間的兩個數值的平均數(例如2、3、4、10的中位數為[3+4]÷2=3.5)。
一般而言,平均數係最常被使用做為數據嘅集中趨勢,但如果有極端值存在,平均數嘅代表性就會降低。因此在有極端值嘅狀況下,中位數是比較好嘅集中趨勢代表,例如計算香港人每月收入分布。

4. 分佈域 Range

分佈域(Range)= 最大的數據 減去 最小的數據(Largest data – smallest data),例子: 五人體重分別為 50kg, 60 kg, 65 kg, 67 kg, 80 kg,分佈域則為 80 – 50 = 30 kg(需要寫單位)。
注意分佈域只係指出「最大同最細數據嘅差距」,並唔一定可以準確咁指數據嘅分散程度。
例如:
A組數據1、3、6、100,分佈域為 100 - 1 = 99;

B組數據1、33、66、100,分佈域為 100 - 1 = 99。
雖然AB組分佈域相同,明顯A組的頭三個數據更接近,其中100只是離散數據,影響整個統計分析。
因此為了更準確知道數據分佈,數學家提出「四分位數間距」槪念。

5. 四分位數間距 Inter-quartile range

四分位數間距(Inter-quartile range)= Q3 - Q1
當中 Q3 為上四分位數(Q3 is 75% of the data)及 Q1 為下四分位數(Q1 is 25% of the data)
求數據 1, 100, 2, 6, 3, 7, 7, 8, 11 的四分位數間距
先把數據按大細排好:
1 2 3 6 7 7 8 11 100
然後指出25%、50% 及75%,即:
1 2 | 3 6 [7] 7 8 | 11 100
所以
Q1 = (2+3)/2 = 2.5
Q2 = 7
Q3 = (8+11)/2 = 9.5
所以,四分位數間距 = 9.5 - 2.5 = 7
AfterSchool

AfterSchool

AfterSchool 是一個針對DSE而設的網上補習平台,課程涵蓋多個 DSE 科目,讓同學足不出戶就可以享有優質教學。註冊用戶人達 50,000 人,當中超過四分之一學生為應屆文憑試考生,是全港最大型網上補習平台。