統計遊行人數要客觀科學Back

陳素娟
(香港大學統計及精算系講師)
 

註:本文只代表作者個人意見,與香港大學立場無關。

 

遊行對於港人來說,除了是一種表達意見的途徑,更漸次形成一種文化,以理性、守規為主。中央政策組委託專業研究機構統計「四一一」的遊行人數,引起社會人士的關注與討論,其中一個討論的範圍,便是如何統計遊行人數?雖然統計的動機和發放方法可能帶有政治考慮,但統計方法本身卻是一門科學命題,應該用客觀、科學的方法處理。

 

點算遊行人數最困難的地方,莫過於人流的路線、速度及進出流量等,均會隨著環境及時間轉變。如果採用抽樣推算,卻沒有好好掌握這些資料,推算會流於粗疏。但一個更加基本的問題,是如何界定遊行參與者?在起點站久候折返、為避過人潮而中途加入、及因為種種原因而中途離開的遊行人士,應否被計算在遊行人數當中呢?其實一些點算數字間的差異,可能只是源於對遊行參與的不同定義。舉例說,採用定點站位點算遊行人數,便會剔除了在該站前離開、或在該站後加入的遊行人士。即使增加定點站位數目,亦不能解決在點與點間進出的人數,屬於下限點算。

 

其實遊行本身只是一種表達意見的途徑。如果只為點算的方便,便把?有經過點算站、甚或終點站的遊行人數刪除、或隨意假設這類人士的多寡,都是不合理和不科學的。當然,如何調整則要視乎他們數量的多寡,而數量的多寡又要視乎整體遊行的人數、路線的安排、人流的控制、及當時的實際情況。以七一遊行為例,筆者認為適量的調整以計算遊行的總人數實屬必要。

 

如何點算那些進出遊行隊伍的人士呢?以普遍採納的定點站位點算方式為例,遊行人數可用經過定點站位的推算人數,再乘以一個調整基數作出估計。該項基數其實就是代表相對於每一位經過點算站的遊行人士,整體參與人數有多少。舉例說,倘若調查顯示在100名參與遊行的受訪者中,有80位經過某一點算站,則有關基數便是1.25(即100/80)。問題是調查若在遊行當日進行,受訪者無法預計他將會在何處離開。即使調查在終點站進行,亦只可捕捉到那些在中途加入,直至到達終點才離開的遊行人士,至於那些在中途進出的遊行人士,仍然無法包括在內。若要計算他們的數量,一個事後的抽樣調查實屬無可避免,問題是調查的數據可靠嗎?我們會擔心受訪者虛報資料,如把沒有參與說成曾經參與,但對於曾否經過某某點算站的問題,其偏差應該沒有方向性。亦即是說,部分虛報者可能說有、部分卻說沒有。退而求其次,倘若真有虛報者,而其答案真的帶有方向性,以常理推斷,自稱曾經通過某某點算站的虛報者,可能會比說沒有者為多。如此,則只會令基數下調,使遊行人數的推算趨向保守。

 

有學者認為,提供遊行人數推算的誤差數據屬於必要,筆者當然不會反對,但以帕松過程(Poisson Process)模擬人流數量,把特定時間內的點算值當作模型的離散(Variance)處理,其論據必須獲得證據支持。至於採用「捕亦捕」(Capture and recapture)的方法以推算中途進出的遊行人數,當中涉及不少技術問題,其可行性有待實踐驗證。

 

其實,那套統計方法較為適合,很視乎整體遊行人數的多少,路線的安排及統計資源的運用。我們應該要充份掌握每套方法的局限,持開放的態度互相比較和討論。若為爭論數字的多寡,而忽略了數字背後的訊息,實在沒有必要。