點算人數方法系列返回

遊行集會的靜態點算方法

陳素娟
(香港大學統計及精算系講師)
李亮坤
(香港理工大學應用數學系助理教授)
 

註:本文只代表作者個人意見,與所屬大學立場無關。

 

繼「四一一」遊行之後,「七一」遊行人數的統計再次引起爭論。作為專事研究統計的學者,我們就時下的討論提供一點意見。我們今天首先討論靜態點算方法,明天再討論動態點算方法,及我們對今年七一遊行人數的估計。

 

首先聲明,我們無意介入任何政治層面的爭拗。事實上,遊行集會人數的多寡,與市民訴求的強弱和質素並無必然關係。在一個民主開放的社會,政治層面的的數字比拚,往往體現於選舉及相關的公決制度,或充其量擴展至民意調查的結果。以參與遊行集會的人數作為意見強弱的基準,似乎只會出現在相對封閉的社會,希望香港不會朝著這個方向發展。

 

從另一個角度看,當社會開始引用群眾數字作為決策依歸的時候,無可避免地各方人士總會對數字本身以至數字背後的社會現象,根據各自的理念作不同的詮釋,甚或扭曲。

 

歷年來,在大型遊行集會之後,主辦機構公佈的數字,往往與官方機構的統計相距很遠。我們認為,如果科學精神要在我們的社會植根、開花結果,則我們一定要有求真問究的勇氣,破解這個迷思。身為研究統計的專業人士,我們覺得責無旁貸。

 

經過初步研究,我們有理由相信主辦機構和官方數字的出入,是源於不同的量化定義和統計方式。例如:集會人數是否包括短暫駐足的人士?遊行人士是否包括只在起點結集而沒有隨隊出發的人士?如果主辦機構以派發場刊的數目去估計集會的人數,而警方就只以某時段的人流面積去估計當時的人數,則兩者所得的數字,自然會很大的差距。雙方都是基於實際需要和運作去估計人數,但可能與事實真相出現距離。

 

為了探究有關問題,我們一群來自不同院校的朋友,包括來自中文大學的蘇鑰機和郭婉鳳、香港大學的鍾庭耀、和我們兩個筆者,在5月籌備點算今年六四燭光晚會的人數。在總結六四的經驗後,在6月下旬,我們又決定點算今年七一遊行的人數。我們的目的只在求真。

 

各樣方法的歸類

 

首先,有關遊行集會人數的統計方法,我們按其應用特性分為兩大類。第一類方法是先以某些方法如高空拍攝,估計遊行集會人士佔據路面的密度,再乘以場地或路面面積,以推算在某一個時刻佔滿場地的總人數。這類方法常用於靜態活動的點算上;若要應用在動態活動如遊行上,則再以該佔滿遊行路線的人數推算,乘以一個在遊行期間可行畢的程數,推算整體遊行人數。

 

另一類方法是定點點算,即直接在某個站位點算經過的遊行人士,基於人力的限制,通常只作系統抽樣,點算在抽樣時段內經過的遊行人士。由於此方法無法點算中途加入或離開的遊行人士,故部份研究會再進行一個抽樣調查,以評估經過點算站的遊行人士佔整體遊行人士的百份比。舉例說,若調查顯示在一百名參與遊行的受訪者中,有八十位經過某一點算站,則在該點算站只可點算到八成的遊行人士;因此,要推算遊行的整體人數,便需要把經過該點算站的人數,乘以1.25 (即100除以80的商) 作為調整基數。

 

六四燭光晚會的點算

 

我們嘗試用不同的方法來計算參加今年六四燭光晚會的人數,包括先錄影后點算、全部點算及抽樣點算,這些方法均屬於第一類的靜態推算法。但錄影方法因影像欠佳,效果不理想,令點算很困難。而全部點算法的結果亦不可靠,不同組別間的數字相差很大,所以也只好棄用。於是抽樣點算成為主要的方法,它是以密度乘以面積作為計算基礎的。

 

計算密度是以一個三米乘三米的空間為標準。我們在維園六個足球場內,有系統地在晚會的高峰期抽樣量度此空間所盛載的人數,得出的平均數是廿五點三人,即每平方米人口密度是二點八一人。我們在現場又做了一個實驗,發現在兩米乘兩米的面積中,可緊密地容納十個人,即每平方米是二點五人,與上述數字接近。

 

我們又量度了六四燭光晚會現場六個足球場的觀眾面積,所得數字是一萬四千九百一十七平方米。因此,以密度乘面積,所得人數是四萬一千九百人,但此僅是在足球場區內的人數,並未包括場區外圍的人。我們又派出三個小組點算外圍人數,其中包括坐在後面的觀眾看台及草地的參加者,但不包括警方及其他工作人員,所得的數目是約九千四百人。因此,以密度和面積推算,不計算中途加入或離開的人,我們估計總參加人數約是五萬一千人。

 

七一遊行的靜態推算

 

至於點算七一遊行人數方面,警方、民陣、《明報》都是以場地面積作計算基礎,並乘以某一時間的人流密度及在遊行時間內可行畢的程數,來推算整體遊行人數。

 

警方根據拍攝所得的人流密度,乘以所需遊行時間速度,得出總遊行人數是大約二十萬。警方曾向民陣表示,如果遊行路線全程都充滿了人,應有十七萬。民陣根據警方這個密度數字,乘以他們運算出來的遊行程數,再略加調整以反映中途離隊人數,得出五十三萬之總數。

 

《明報》則利用高空拍攝的照片,經電腦計算相中人數,從而計出平均一百平方米容納一百人。該報再推算遊行路線面積為七萬二千平方米,從而計出全程的人數為七萬二千人。遊行時間方面則以五小時半為基準,每程用了一小時半,即共有三點六七程,最後推算遊行人數為廿六萬四千人。

 

這些計算方法的準確程度,視乎面積、密度和時間這三個因素。面積方面的爭議不大,密度則是個大問題。依據警方十七萬的數字,計算出來的每平方米人口密度是二點三六人。但用《明報》的數字作推算,每平方米人口密度只是一人。我們的研究隊在七一遊行當日,發現每分鐘的人流量約為七百人。假設人流速度為每分鐘五十米及馬路的平均寬度為廿米,得到每平方米的密度為零點七人。如果假設人流速度為每分鐘三十五米,得到每平方米的密度為一人。

 

從上面簡單的實驗及六四燭光晚會實際情況得知,每平方米人口密度達二點五人的情況,只會在肩踫肩的極擠迫環境如銅鑼灣才會出現。按常理推測,流動遊行人士的平均人口密度,應低於這個數字,以每平方米一人較為合理,即與《明報》所得的數字相若。

 

第三是時間。如果遊行路線全程三千米,以整體遊行隊伍由頭到尾都經過某一點判斷總遊行時間約為四小時,又如每程需一個半小時,得出應是二點七程。因此,如果用《明報》的七萬二千人作基礎,乘以二點七,得出十九萬四千人。如果用《明報》的遊行時間五小時半為基準,共有三點六七程,最後推算遊行人數相差不可謂不大。這些數字與我們採用定點點算法得出來的結果有多大的差別,我們會在明天討論。

 

動態點算七一遊行人數

 

我們昨天介紹了靜態點算六四集會和七一遊行的方法,談到面積、密度和遊行時間的關係。我們今天會集中討論動態的人數點算方法,及用這個方法推算今年七一遊行人數得出的結果。

 

七一遊行的動態推算

 

基於人力的限制,我們採用了定點點算法統計七一的遊行人數。我們以軒尼詩道與軍器廠街交界的行人天橋為點算站,六位義務學生分別負責點算一條行車線的人流,以每五分鐘點算一分鐘的方式,作系統抽樣點算,然後將一分鐘內點算到的人數乘以五,作為在該五分鐘時段內經過的遊行人數。以此計算,得到所有經過該點算站的人數約為十四萬九千人。為了評估調整基數,研究隊遂於7月2至11日期間,以隨機抽樣電話訪問形式,成功訪問了3,512位年滿十八歲的巿民,平均回應率是百分之六十三點八,其中二百三十一位曾參與七月一日遊行。他們回答了下列問題:你遊行時有沒有經過軒尼詩道與軍器廠街交界的行人天橋,從灣仔進入金鐘地段?在該些巿民中,百分之七十七點四謂曾於軒尼詩道經過該道天橋,故調整基數為 1.29 (即100除以77.4得出的商) 。將基數乘以十四萬九千的點算人數,並以純抽樣誤差六個百分比計,推算整體遊行人數約為十八萬至廿一萬之間。

 

我們採用事後進行的抽樣調查,因為調查若在遊行當日進行,受訪者無法預計他將會在何處離開。即使調查在終點站進行,亦只可捕捉到那些在中途加入,直至到達終點才離開的遊行人士,至於那些在中途進出的遊行人士,仍然無法包括在內。由香港大學統計及精算系高級講師葉兆輝領導的另一支研究隊,在銅鑼灣及金鐘分別有點算站,並在金鐘太古廣場附近天橋進行抽樣調查以計算調整基數。可惜,他們的調整基數,並未能包括在銅鑼灣點算站與金鐘調查站之間加入並離開,以及在金鐘調查站後加入的遊行人士。他們在整體遊行人數上加上百分之十作為調整,雖是無可厚非,但以百分之十作為調整基數具有相當的主觀成份。

 

各種推算方法的局限

 

平情而論,筆者論及的每一個推算方法,皆有其局限。按遊行人士佔據路面密度推算總遊行人數的方法較為粗疏,因為推算要基於多項假設,所以根據不同的假設,推算的數字間差異很大。除了人流密度可能被錯誤評估外,受著路面情況的影響,不同時段與地點的人流密度差異可以很大,而以程數估計遊行人數的部份,亦會受到當日的天氣,以及遊行人士的年齡有所影響。理想的處理方法,是在不同時段與地點,收集多個數據樣本,以期對人流密度作出較精確的評估;可是,在計算上又會變得十分複雜。

 

雖然如此,這類推算方法仍無法計算中途加入或離開的遊行人士。在七一當日三十五度非常高溫下,假設扶老攜幼的遊行人士,只能行畢三分之一的路程,則整個遊行期間的程數假設便要相應增加,因為對於這類遊行人士而言,實際的路程減少了。到底這類遊行人士有多少呢?他們平均行多長的路程呢?這些因素均會影響推算的準確性,但極難評估,因為要接觸這類遊行人士並不容易。

 

即使採用定點點算法,如何點算進進出出的遊行人士,仍然是一個很大的難題。理論上,一個事後進行的抽樣調查,可以接觸到不同的遊行人士,但因為抽樣對像全是年滿十八歲的市民,要累積一定數量的遊行人士樣本,要相當的時間及資源。讀者可能亦擔心受訪者會虛報資料,如把沒有參與說成曾經參與,不過,就算如是,其偏差應該沒有方向性。但由於調查只限於年滿十八歲的遊行人士,十八歲以下遊行人士的情況便沒法反映出來。

 

讀者或許已注意到,不單按人流密度的多個遊行人數推算存在著很大差異,即使在相近地方作直接點算的遊行人數亦有很大差異。舉例說,本研究隊在軍器廠街天橋接近金鐘的點算站共錄得十四萬九千名遊行人士經過,而葉兆輝領導的另一支研究隊在金鐘太古廣場附近的天橋卻點算得十一萬人,兩個點算站相距不遠,但人數卻相差了四萬人。同樣地,葉兆輝領導的研究隊在銅鑼灣電業城點算到十二萬遊行人士,而《星島日報》刊載的大埔專上學生同盟研究隊,亦於銅鑼灣作點算,他們採用每十五分鐘拍攝一分鐘人流,然後投影及點算人流的方法,點算到途經該點算站的遊行人數為九萬人,兩者之間亦相距了三萬人。若非點算不準確,則中途加入或離開的遊行人數確實不少!

 

最後,筆者希望再次強調,在面對眾多的推算結果時,不應單看一個點算數字,要對各種推算方法的可信性及局限例如推算的假設是否合理等作深切理解。就本文提及的各項研究推算,只有本研究隊及由葉兆輝領導的研究隊,有報告推算誤差。其實推算誤差,可以讓讀者評估推算的可信性,若推算誤差大,則其可信性便較低。比方說,若推算誤差為十萬人,對於一個二十萬的推算值,其確實數值應該在十萬至三十萬之間,上下限相距甚遠。況且,本研究隊報告的推算誤差,只反映了來自調整基數的誤差來源,對於來自系統的抽樣誤差,即以一分鐘的遊行人數推算五分鐘內的總遊行人數的誤差,及其他非抽樣誤差,皆沒有被反映出來。

 

怎樣才可以更準確有效地統計遊行人數,是一道非常有趣的研究題目。不過,筆者認為,掌握群眾的訴求應該遠較討論遊行人數重要。此外,市民亦應公正客觀地評價各項統計結果,不要單看數字本身,因為各種統計方法均有其局限,未可盡信!