特首評分的波動返回

鍾庭耀
（香港大學民意研究計劃主任）

註：本文只代表作者個人意見，與香港大學立場無關。

特首曾蔭權的民意支持率最近再創新高，為即將發表的施政報告創造了良好環境。所謂民望有起有跌，筆者希望在新一輪施政辯論前，接力探討特首民望波動的問題。

中文大學亞太研究所副教授王家英早前在《新報》撰文探討中大亞太研究所與港大民意研究計劃的特首民望評分出現差異的問題。本文旨在補充說明有關論點，豐富討論。

王家英文章列舉了三個原因，解釋兩大調查的差異。第一，是抽樣誤差的問題。文章解釋：「中大的調查平均約六百至八百個的樣本數和港大約一千個的樣本數......若按這兩間大學所進行的特首民望評分計算，當中涉及的抽樣誤差約在1分至1.5分之間。換言之，中大和港大每次所做的調查結果出現2分至3分的差異，其實都可能是自然的抽樣誤差導致，不值得太過驚訝。」

調查誤差是一個相當複雜的問題，當中涉及抽樣誤差和非抽樣誤差。單以抽樣誤差而論，評分數和百分數的誤差亦不能一概而論。不過，簡而言之，20次調查中出現一次不規則波動，屬於可以接受的自然現象。

至於非抽樣誤差，很多調查機構都會嘗試用不同方法把它控制和壓縮，包括嚴謹的抽樣方法、質量控制、統計調整等。以港大民意研究計劃為例，一般原始數字都會按照人口普查的結果，根據年齡和性別的分佈加權調整。嚴謹的讀者，應該小心審閱調查報告中關於調查方法的描述，和各項樣本資料。

王家英文章列舉的第二個原因是調查時間和頻次的問題：「中大每月只進行一次，時間是在每月的下旬，而港大則每月進行兩次，進行的時間是在每月的上旬和下旬......較有意義的做法是將中大和港大在同一期間（每月下旬）所做的調查進行比較。即使如此，由於兩間大學很少在完全重疊的時間進行調查，上述的比較的主要意義其實也只在於相互參考，因為一兩天的調查時間落差，也可能因不斷發生的社會政治事件而使得市民對特首的民望評分出現快速的變化。」

這是一個極之重要的分析，筆者舉出一個近期例子加以說明。今年8月底，正當曾蔭權的民望評分下跌至上任特首後新低時，發生了男童岑浩賢遇襲案和曾蔭權高調宣佈率領所有立法會議員北上訪問。兩者分別在8月25和30日發生，傳媒在8月27日大幅報導曾蔭權「人神共憤」的評語，然後在8月31日大幅報導議員北訪的宣佈。

港大民意研究計劃剛巧在8月22至25日進行定期民意調查，得出特首評分64.8分，而中大亞太研究所則在8月24至26日進行調查，得出68.4分，兩者相距3.6分。港大接著一輪的調查在9月1至5日進行，得出特首評分66.7分。根據港大調查的按日數據分析，曾蔭權的民望評分在8月22至25日期間仍然不斷下跌，但不到一個星期後便已回升兼且平線波動。結論甚為明顯，曾蔭權的民望走勢在8月26至31日期間出現了重大變化，而男童遇襲案和議員北訪的消息就在期間發生。

筆者在及後的新聞公佈中分析：「曾蔭權的民望在9月初扭轉跌勢......相信是與他在男童遇襲案中的反應和宣佈率領所有立法會議員訪問珠三角有關。」筆者沒有援引按日數據加以說明，是因為按日樣本不足，誤差較大，亦不符合一般公佈的慣例。不過，以數論數，關係相當明顯。筆者估計，如果王家英能夠把中大亞太研究所在8月24至26日期間所得數據按日分析，應該可以更加清楚說明男童遇襲後，曾蔭權一句「人神共憤」的民意效應。因為中大的調查剛好跨越事件前後，而港大的調查則要用兩次調查加以推敲。

王家英文章列舉的第三個原因是中大和港大調查的問題設計不同：「港大只有一條簡單的問題......中大的調查則要求被訪者對特首在十一個領域的表現進行評價......港大量度的是市民對特首的支持度，而中大量度的是他們對特首的表現評價。兩個概念不盡然相同......中大的調查結果波動較小，而港大的調查結果則波動較大，主要原因當然是中大的調查較沒有港大的調查那麼容易受到當時社會政治氛圍的影響。」

在這方面，筆者希望補充說明的，是港大調查的慣例，是把特首民望的題目放在調查前端，刻意記錄沒有提示下的印象評分。當然，題目放在前端可能會影響被訪者對其他問題的思考。但在沒有兩全其美的情況下，我們希望確保香港最高領導人的評分，不論是以前的港督或現在的特首，都可以在簡單穩固的基礎上作出長期的比較，其他分析須要讓路。

總而言之，中大、港大以至其他專業機構的調查，基於調查方法、時間和頻次的不同，數字上出現些微差異不足為奇。比較重要的，是各項調查的宏觀趨勢是否一致、及微觀波動是否可以解釋。

最重要的，是所有機構在發放調查數字時，按照國際社會的專業守則詳細交代有關調查的研究方法、樣本資料、問卷全文、調查日期、抽樣方法、回應比率、加權過程和誤差範圍等。只要資料公開、運作透明，問題自有解決方法。

數表：曾蔭權評分按日走勢

日期	22/8	23/8	24/8	25/8	1/9	2/9	5/9	6/9	7/9
評分	66.3	65.6	65.6	63.0	67.4	66.1	65.7	67.2	67.1
誤差*	+/- 2.6	+/- 2.2	+/- 2.2	+/- 2.0	+/- 3.0	+/- 2.4	+/- 2.2	+/- 2.0	+/- 2.2
評分	64.8				66.7
誤差*	+/- 1.2				+/- 1.0

* 以95%置信水平計，即倘若以不同隨機樣本重複進行有關調查100次，則95次的結果會在正負誤差之內。