希格斯玻色子 vs 六合彩頭獎

大眾媒體常常大幅報道尋找「上帝粒子」——希格斯玻色子(Higgs boson)——的故事。也許是因為歐洲粒子物理研究所(CERN)花費之鉅,也許是因為「上帝」一詞符合某些報章一貫的渲染手法。 事實上當中牽涉的Standard Model (of particle physics)已大多被驗證,不及String Theory 或者 M-theory 般大膽精彩、引人入勝。這裡先放下物理不管,日後再談。

明報這篇報道我笑了一整個早上,以fair use 引用整篇如下:

「發現」嚴格定義 如擲公字20次相同

何謂「發現」,在粒子物理學界其實有一套獨特的定義,那就是「肯定程度」達到統計學上5個標準差(standard deviations)的極嚴格程度(另一個說法,達到5級sigma程度的肯定)。聽起來雖然艱澀,但可以換一個常人較易理解的說法﹕肯定程度達到5個 標準差,大致相當於連續擲20次公字,都擲出同一面向上。這意味觀察結果,極不可能是運氣使然。若達不到這水平,便只能稱作「觀察」,不能稱作「發現」。 消息指目前科學家在尋找上帝粒子上所得出的觀察,達到「3個標準差」水平,相當於連續8次擲公字擲出同一面。 (來源:http://news.mingpao.com/20111213/tba2.htm

粒子物理學界有甚麼獨特的定義我不清楚,但該報的定義則令人大開眼界。統計學上,one-tailed test 要達到5 個標準差或以上的可信程度(或置信區間、confidence interval),那大概是說實驗結果要有99.99997%的確認機率。而「連續擲20次公字,都擲出同一面向上」的出現機率,是0.00019%。(1)

99.99997%跟0.00019%相差可不謂不大。嘿,以為一味誇張就可以愚惑大眾嗎?

再想多一層,該報應該沒人會想得到擲毫的比喻(又,「連續擲毫20次」 比「連續擲20次公字」順眼多了)。Google了一下,找到了以下報道。Benefit of doubt--該報是否把報道搬字過紙,有待讀者決定。

(粗體由我所加)

Discovery has a technical definition in the world of physics: a discovery must have a certainty of 5-sigma. That means that the chances of being wrong are about the same as flipping a coin and having it come up heads 20 times in a row – less than one in a million. In other words, discoveries must have a fantastically low probability of being wrong. The results to be presented on Dec. 13 are not yet at that level of certainty, but perhaps as early as next year, CERN expects to get there.  (Source: http://www.ksl.com/?sid=18426801&nid=1012)

差之毫釐,謬之千里也。

同情地了解,該報可能只是漏了「誤差」二字。但其實「同一面向上」跟「come up heads」分別也大。「同一面向上」,可公可字也。連續二十個公或字機會,是連續二十個公的一倍。就英文版本而言,意譯應為「五個標準差的嚴格程度,其誤差大概為連續擲毫20次都出現公字向上的機率」 。(2)

Reuters 的比喻其實更加生動:

In the jargon, this level is described as 5 sigma. […] As one scientist explained, that level of accuracy would equate to the 17th-century discoverer of gravity, Isaac Newton, sitting under his apple tree and a million apples one after another falling on his head without one missing. (Source: http://www.reuters.com/article/2011/12/13/us-science-higgs-brick-idUSTRE7BB27K20111213)

於我來看,其實五個標準差的嚴格程度也不算是甚麼。你中不了六合彩頭獎的可信程度,還要比他朝一日「發現」希格斯玻色子時的可信程度高。(3)

 

(1): (1/2 ^ 20) x 2 x 100% = 0.00019%

(2): 再說,最接近的誤差實為二十二次公字向上,(1/2 ^ 22) x 100% = 0.000023% 。但數據上之錯漏為訛誤,邏輯上的錯漏為謬誤。承李天命博士之習慣,指出謬誤為重,糾正訛誤次之。更何況,這裡用的全是大學一年級的統計學。旨在演示,未有深究粒子物理學的數理。

(3): 1-[1/C(49,6)] = 99.9999928%--這是你中不了六合彩頭獎的機率--大概5.26個標準差。