鍾庭耀的統計學

(原文寫於柬埔寨回港途中。爛尾至今,又見鍾庭耀博士捲入政治風波,續寫如下。原題《Statistics,多少惡行假汝之名而行?(二)》,而今借此文章向鍾致敬。)

當年鍾庭耀博士在他大學的辦公室內,侃侃而談了兩個多小時,我大概只有聽的份兒。那時候走出來的感覺是吁了一口氣。心想各方對這學者一向譽多毁少,卻猜不到他會這麼囉嗦。今天想來,他大概是有點知音難求的感慨。難得有學生如我對象牙塔以外的統計學有興趣,自然傾囊相授。雖然我肯定他連我的名字也忘了,但我還是欠他這一個人情。

現在我再把自己的意見綜合起來,在飛機上寫上四個小時來博各位看兩分鐘,也有一點姜太公釣魚的滄涼了。

  • 九成牙醫選用某牌子牙膏/牙刷/牙綫/牙籤
  • 八成被訪者贊成全港禁煙
  • 候選人認為豬也能勝任特首一職
  • 六成市民不滿意政府表現

有償採訪 (Paid Survey):牙醫跟牙刷

論據顯而易見,是統計本身跟受訪對象有直接利益衝突。當然不能一概說有償採訪便不可靠。就如小組訪問(focus group)、長時間觀察(數日至數年計)或者專業人士意見(e.g. 腦外科醫生)等,適度的金錢或其他形式的補貼可以令受訪對象更能代表一般普羅大眾,而不偏向於一小撮熱衷於該統計項目的人。反之,如果將一箱雜牌牙刷跟一箱某牌子牙刷,放在牙醫面前讓他選擇為「試用品」,然後宣稱「九成」牙醫都選用其牌子--這不只是直接利害關係,更犯了答案導向的錯誤。下文再續。

不完整/不正確抽樣 (Incomplete/Incorrect sampling):反對吸煙

如果聽到「高達八成」(1)被訪者贊成一件事情,你可能會想這個統計結果也頗有說服力。但假如八成被訪者是非吸煙人士,而同一批人又贊成全港禁煙的話,結果仍只是「一個立場、各自表述」。統計與否,並無新數據去支持或反對全港禁煙。

又,假設明天所有香港人要回答一條問題:「你贊成李嘉誠先生拿七百萬元出來,分給七百萬個香港人嗎?」如果有「高達八成」受訪者贊成的話,我們是否要立法監管李嘉誠的資產?我們大部份人也許會覺得可笑,因為毫無理據地將某人賺回來的錢強行收起,然後分給別人的話,那差不多是共產主義社會的表現。可是當下仍堅守資本主義的香港,卻仍然有「高達八成」人贊成向富人大幅徵稅,然後補助窮人。

(這裡也有少數服從多數的吊詭--就是民主投票卻讓大多數人搾取了一少撮人的自由或利益。此觀點暫且按下不表。)

混合問題 (Composite questions):候選人不認為豬不能勝任特首一職

問:「像你豬一樣蠢的人,如何能夠勝任特首一職?」
答一:「我是龍年出世的(2)……」這代表你真的像豬一樣蠢。

答二:「我深信、我確信、我自信我有能力勝任……」這代表你未必像豬一樣蠢,但你既然已經回答,便算是默認了提問者的假設。

答三:「我不能回答你的提問,因為你的問題混合了我不認同的假設。真理越辯越明,何需動輒拿文字遊戲出來嘩眾取寵?」這代表你明白邏輯學跟統計學上的謬誤。但當面識破別人的詭計,沒留有下餘地,亦不算是當特首的好材料。只好怪我不是屬龍。

答案誤導(Biased answers): 政府表現與港人認知

有做過類似的問卷調查嗎?

你覺得近三個月的政府表現如何?

  • 完全不能接受
  • 非常差
  • 頗差
  • 一般
  • 頗好
  • 非常好

答案裡正、負面的比例明顯地不對稱。這例子小學生也懂。再看一下城中的焦點問題:

你會稱自己為 (訪問員讀出首四個答案)

  • 香港人
  • 中國人
  • 香港的中國人
  • 中國的香港人
  • 其他 (請列明)
  • 唔知/難講
  • 拒絕回答

http://hkupop.hku.hk/chinese/popexpress/qre/que_18/que_18_q02.html

郝鐵川說不合邏輯,你說是不是?有趣的是,鍾庭耀博士說其實一早認同郝鐵川的說法。

鍾又稱,由於「香港人」、「中國人」、「香港的中國人」及「中國的香港人」四者或有意識重疊,民研後來改良,利用0至10分的評分準則,測試市民對「香港人」及「中國人」的認同程度。 (擇自明報,2011年12月30日)

如果所有有心人都親自走上香港大學民意研究計劃的網站,找《巿民的身分認同感》的調查來一看的話,便不會有這麼多風波。鍾明知答案或有重疊,經改良後仍保留原有問題,其箇中原因大概是為了保持研究連貫。其實早於1997年已經設有此問題,而2008年奧運其間選擇「中國人」的比例升至38.6%歷史新高。為甚麼那時候沒有人走出來罵鍾庭耀博士親中媚共呢?

很多人說鍾庭耀的民意調查常有他本人的政治取態。但更多的情況是,當民意調查的結果跟批評鍾庭耀的人的政治取態不同時,他們才會走出來罵。這叫做輸打贏要。

See also:(1): 「高達八成」已經被濫用而變成了網絡上的潮語。
(2): 當記者問到有人把他跟梁振英的特首選舉看成「豬狼之戰」時,唐英年如此回應。

Statistics,多少惡行假汝之名而行?(一)