「立法會補選滾動調查文章系列之一：加權分析和論壇效應」Back

鍾庭耀
（香港大學民意研究計劃主任）

註：本文今日在《香港大學民意網站》(http://hkupop.pori.hk)發表，所有觀點只代表作者個人意見，與香港大學立場無關，歡迎傳媒節錄或全文轉載。

筆者在1995年開始在選舉年進行選前滾動調查，時至今日已有12年歷史。歷次滾動調查的方法和結果都在《港大民意網站》全面公開。2004至2005年間，筆者更在報章及《民意網站》發表了四篇文章，介紹選舉滾動調查的理念和方法，包括2004年9月11日發表的《滾動調查小常識》、2004年11月1日發表的《美國總統選舉的滾動調查》、2004年11月2日發表的《美國大選：滾動民調以外》和2005年5月17日發表的《英國大選的滾動調查》。

滾動調查與選舉工程無關

今年，筆者主持的香港大學民意研究計劃，如常在立法會香港島選區補選提名期結束後開始進行滾動調查，方法不變。就筆者觀察，一般學者專家對滾動調查的認識已經加深，部份人士好像也在進行滾動調查，這是一種進步。不過，筆者聞說，也有社會人士私底下批評筆者的滾動調查。有見及此，筆者希望透過數篇簡短文章，介紹一下今年滾動調查中一些具參考價值的數據和箇中局限，增加巿民對滾動調查的認識。

筆者首先聲明，為了保持研究中立，文章中所有分析，從來沒有預先交給任何參選人士或政黨。相反，時下有不少政治團體透過看似中立的研究機構進行各種調查，作為選舉工程的重要部份。該等發展，確實令人關注。

多年前，有評論認為滾動調查的按日樣本不多，屬於「翻炒冷飯」。又有評論認為既然樣本是按日收集，何不公佈單日結果？針對上述問題，筆者在《滾動調查小常識》一文中已經詳細討論，在此不贅，筆者只想補充說明一點，就是不論何種調查，當分析單位縮細，次樣本數目便會變少，抽樣誤差便會變大。

小額分析應該採用長期樣本

就以筆者正在主持的補選滾動調查為例，現時的按日樣本為300個以上，三日滾動樣本接近一千個，抽樣誤差大約控制在3個百分比內。換言之，任何以連續三天調查錄得的整體樣本數字，一般誤差都可能會有正負3個百分比。

不過，倘若我們要進行一些次樣本分析，例如是年齡、學歷、以至政治取向的分層分析，次樣本數目便可能大幅減少，誤差大幅增加，數字出現不正常的波動。因此，要處理「小單位」的深入分析，最好是採用比較長期的滾動樣本，例如5、6、7以至10天滾動樣本等，情況就如股票市場分析中的「10、50、250天平均線」一樣。部份讀者如果不欲分析短期波動，大可把我們的數據合併處理。

原始與加權數據的差異

在統計學上，不平衡次樣本的問題可以酌量使用加權方法處理。例如，如果真的須要分析每日300個樣本的獨立走勢，我們可以把調查所得隨機樣本，按照已知的選民特徵加權處理，增加樣本的代表性。以筆者現正進行的調查為例，我們的數據分析員其實每日都仔細分析按日樣本的特性、原始與加權數字的差異、按日數字與三日滾動平均數字的差異、以及各個人口變項的變化因素，以便判斷三日滾動數字的準確程度。不過，該等分析純屬內部質控範圍，沒有向外界透露。今日，為了增加社會各界對滾動調查的認識，筆者在此介紹兩項有趣的分析。

圖一 10月31日至11月26日滾動調查中，市民對葉劉淑儀及陳方安生支持程度的變化，以三天滾動計：

附圖顯示，以截止11月26日的三天滾動樣本計，不論是使用原始數字或以選民性別年齡為基礎的加權數字，兩名主要候選人之間的支持率走勢基本上沒有太大分別。整體而論，兩名候選人之間的距離，加權數字有時會比原始數字略大，但這種情況在有些時候特別是最後階段似乎又不明顯。民研計劃一直採用三天原始滾動樣本作為統計基礎，一則因為政府沒有公報香港島選民的人口結構，加權數值須要依靠間接估計，其次，民研計劃一直強調所有選舉調查都存在誤差和變數，例如隱性票源和游離選民等，不應過份解讀。因此，筆者選擇用最簡單的方法描述數據，但同時又把各項詳細數據在網上發放，並在適當時候作出解釋，增加巿民對有關數字的理解。詳細數字請參閱附表一。

電視論壇效應

滾動調查雖然可以在滾動框架下探測選情走勢，但遇上可以一日改寫歷史的大事時，滾動調查便有不足之處。例如，八大電子傳媒在11月25日舉行選舉論壇後，受眾的即時反應便未必可以準確調查得到。就算可以，亦可能要等待三數天後，從滾動數字間接推敲。有見及此，筆者在論壇進行當天和翌日，便在滾動調查中加入三條焦點題目，探討論壇的效應。題目分別是：

Q1：你有冇睇過或者聽過由八大電子傳媒合辦既「立法會港島區補選論壇」5分鐘或以上？
Q2：你認為邊位候選人係論壇上表現比較好？
Q3：係呢個論壇之前，你傾向選邊個？

當然，我們亦如常使用以下核心題目作為分析基礎：假如聽日係立法會港島區補選，你會投以下邊一位候選人？

表一市民認為論壇上表現較好的候選人：

	頻數	百分比
陳方安生	74	38%
葉劉淑儀	45	23%
凌尉雲	10	5%
蔣志偉	6	3%
何來	4	2%
柳玉成	1	1%
以上皆否	22	11%
唔知/難講	35	18%
合計	197	100%
拒答	2

表二論壇前後市民支持的候選人：

		論壇後的支持者
		陳方安生	葉劉淑儀	蔣志偉	全部都唔選	未決定/唔知/難講	合計
論壇前的支持者	陳方安生	97	1	0	0	6	104
	葉劉淑儀	0	57	0	1	1	59
	蔣志偉	0	0	2	0	0	2
	全部都唔選	0	0	0	4	1	5
	未決定/唔知/難講	2	6	0	2	15	25
	合計	99	64	2	7	23	195

調查顯示，在11月25至26日錄得的313個次樣本之中，199人曾經收聽或收看有關論壇，當中38%認為陳方安生表現較佳，23%認為葉劉淑儀表現較佳。由於199個次樣本所得數字的抽樣誤差，在95%置信水平下為正負6個百分比，因此，表面上的統計結論是，較多巿民認為陳太在論壇的表現較葉太好。不過，經過深入分析後，筆者發現一個有趣現象，就是論壇過後，以論壇觀眾而論，99個在論壇後支持陳太人士之中，97個自稱在論壇之前就已經支持陳太。換言之，陳太在這方面的進賬是2人，不過亦流失7人，以論壇前104個支持者計，淨減5%。那邊廂，64個在論壇後支持葉太人士之中，57個自稱在論壇之前就已經支持葉太，6個本來未決定，1個本來支持陳太，但亦流失2人，以論壇前59個支持者計，淨加8%。換言之，究竟誰在論壇取勝，不是單一數字可以表達得到。況且，原有支持者一般都是認為自己支持的候選人表現較佳，屬於偏向選擇。

筆者在透過本文向所有社會人士展示滾動調查中一些比較深入的分析，就是希望增加各界人士對有關調查的認識。既不希望讀者過份解讀調查，迷信數字，亦不希望讀者以有色眼鏡審視我們的工作，把政治研究看成政治工作，本末倒置。

附表一 10月31日至11月26日滾動調查中，市民對葉劉淑儀及陳方安生支持程度如下，以三天滾動計：

	原始樣本		加權樣本
	葉劉淑儀	陳方安生	葉劉淑儀	陳方安生
31/10-02/11/2007	35.6%	40.9%	33.1%	43.4%
01-03/11/2007	37.6%	41.4%	35.8%	43.5%
02-04/11/2007	37.5%	43.0%	36.0%	44.6%
03-05/11/2007	35.1%	42.6%	35.8%	43.2%
04-06/11/2007	33.1%	44.1%	32.8%	45.8%
05-07/11/2007	32.4%	45.9%	31.4%	47.8%
06-08/11/2007	33.4%	44.3%	31.4%	46.3%
07-09/11/2007	33.0%	42.1%	31.9%	45.1%
08-10/11/2007	31.3%	41.7%	30.9%	44.4%
09-11/11/2007	27.7%	45.1%	27.7%	47.9%
10-12/11/2007	29.6%	46.0%	29.9%	46.2%
11-13/11/2007	33.8%	43.9%	33.9%	43.9%
12-14/11/2007	37.3%	42.1%	36.9%	42.9%
13-15/11/2007	35.6%	42.8%	34.6%	44.8%
14-16/11/2007	32.3%	46.0%	30.9%	48.6%
15-17/11/2007	31.3%	49.7%	29.3%	52.3%
16-18/11/2007	30.8%	51.8%	28.5%	54.6%
17-19/11/2007	33.5%	49.3%	32.5%	51.5%
18-20/11/2007	31.7%	49.1%	30.8%	51.1%
19-21/11/2007	32.3%	47.3%	31.9%	47.6%
20-22/11/2007	31.0%	47.1%	28.8%	48.6%
21-23/11/2007	33.1%	43.0%	31.7%	44.2%
22-24/11/2007	32.0%	44.7%	31.7%	46.4%
23-25/11/2007	30.6%	46.1%	31.4%	46.3%
24-26/11/2007	31.4%	48.2%	31.7%	49.0%