指正「一成大學畢業生 月入少於五千」的謬誤與訛誤

(此文原屬《鍾庭耀的統計學》的一部份。下筆不久,找來資料查對一下。尋根究底、好事之徒者如我應該不多。可是一看之下不禁拍案而罵,需另文發砲。又可算是《Statistics,多少惡行假汝之名而行?》系列之三。)

話說某調查發現有一成的大學畢業生,全職工作收入每月少於五千港幣(經濟日報,2010年11月24日)。沒有人覆核新聞,只顧爭相轉截。事後各方少不免大事張揚,一時間各路人馬指指點點。一些說要改革教育、一些說要創造就業機會。有說政府的錯、有說大學的錯、有說大學生「高學歷、低收入」,唯恐天下不亂。

該調查由青年事務委員會委託嶺南大學社會學及社會政策系進行。調查報告資料充分、準則客觀,沒甚麼挑剔的地方。該報選了有關全職青年的收入作為題材,算是迎合讀者口味,亦是無可厚非。

先說忽略正態分佈的謬誤(Ignoring the normal distribution)。(1)

統計學上有種東西叫正態分佈(Normal distribution),大學生差不多一定會讀到。物理學、生物學、社會科等常見的現象。舉個例子,一百個學生考試,最通常出現的情況是大部份人得到中間的分數,少部份會拿較高或較低的分數。兩邊不一定完全對稱,但鐘型分佈大都是屬於正態分佈。

要是有一成大學生真的月入低於五千的話,我們要問:「中位數在哪?」、「這是否正態分佈?」、「在相同的標準誤差下,是否有一成大學生高於中位數?」只抽取其中一部份來解讀而不看整個圖案的話,得出來的結論只會是一啖笑。

如果該調查報告是正態分佈、而又有一成大學生月入低於五千,那我們(1)其實不用再大呼小叫,和(2)我們亦不可能有一種社會政策可以把某批大學生的收入增加,而不影響到整個鐘型分佈。試問歷史上有哪個政府可以把所有人的收入都固定在一點?中國搞過共產,辦甚麼人民公社、大鍋飯,最後只得出一鑊粥。

*                                     *                                     *

戲肉來了。

閒人管閒事,我找來了原來的《香港青年發展指標》一看。節錄第49頁相關數據如下:

全職月入學士學位或以上
沒有0.30%
$3,000 以下0.60%
$3,001 – $5,0003.30%
$5,001 – $7,0001.50%
$7,001 – $9,00018.20%
$9,001 – $12,00043.80%
$12,001 – $15,00022.30%
$15,001 – $18,0005.40%
$18,000以上4.80%
合計(人數)336

月入五千以下百分比為4.2%;七千以下為5.7%,是中學生都讀得懂的數字。哪麼10%從何而來?

再看一看第50頁的調查結論:

「……就收入方面,香港勞工及福利局發佈2009 年貧窮指標報告以每月就業收入中位數為$11,000作標準,而對於15-24 歲就業人士的貧窮定義為「每周工作35 小時或以上而每月就業收入少於中位數50%」—即收入少於$5,500……我們以最接近這指標的收入範圍代替,分別是以「$9,001-$12,000」作收入標準、及以收入等於「$3,001-$5,000」或以下視為收入貧窮……」

「 根據這兩項準則,受訪者中每周工作35 小時或以上的收入貧窮青年佔5.3%……此外……學士學位或以上的受訪者之中約有1 成是收入貧窮……」

看出箇中玄機嗎?原來撰文者花了大篇篇幅去界定何為「收入貧窮」,卻在最後用「此外」一詞全部推翻。有一些擁有大學學位或以上的受訪者是被界定為兼職,而當中多達六成收入少於五千元,而全職跟兼職兩組人月入低於五千的平均數剛好就是10%。撰文著突然撇開了「每周工作35 小時或以上」的定義而去無矢放的,不知是有心或無意。但是大學畢業後兼職工作的人,大部份是去攻讀其他學位。兼職月薪低可以理解,卻不代表香港有嚴重的「高學歷、低收入」需要去解決。

所以昨日字字鏗鏘的「一成大學畢業生 月入少於五千」標題,原來只是訛誤一場。三人成虎而又覆水難收,今日大家早已盲從附和,各抒自見。最後恐怕就如達明一派的《十個救火的少年》一歌:「亂說亂說 愈說只有愈遠」……

Update on 5th Jan 2012 : 送佛送到西--發了電郵給青年事務委員會、嶺南大學社會學及社會政策系和經濟日報,告知他們上述有關錯誤。如有回覆將會在此更新。tl;dr – 全職大學畢業生月入五千以下的百分比為4.2%而非10%;所有人都只是以訛傳訛,沒想過去嘗試覆核數據。

(1): 承李天命博士之習慣,指出謬誤為重,糾正訛誤次之。

See also:
Statistics,多少惡行假汝之名而行?(一) 
鍾庭耀的統計學