民意調查台灣藍綠忠誠度時發生辛普森悖論的條件研究

作者 劉柔均 / 嘉義縣立大埔國民中小學

壹、 前言

台灣和美國總統大選在近年,常常發生權威民調公司選前民調和最後大選結果完全不 同的情況。原因之一,就是發生辛普森悖論的情形。本文以 2016 年台灣總統大選選民 結構為依據,探討這樣的選民結構,民意調查藍綠陣營忠誠度時,藍綠陣營忠誠比例 的範圍應如何,才會發生辛普森悖論的情形。以及此時該如何修正,才能得到準確的 忠誠度比例。

貳、 研究方法與設計

定義:某陣營的支持者在投票時,投給該陣營的候選人,這時稱該支持者 為忠誠。

一. 何謂辛普森悖論及辛普森悖論如何影響民調準確性

辛普森悖論:人們探究兩種變量是否具有相關性時,會分別對之進行分組研究。在分組比較中都占優勢的一方,在總評中有時反而是失勢的一方。該現象於 20 世紀初就有人討論,但一直到 1951 年,E.H.辛普森在他發表的論文中闡述此一現象後,該現象才算正式被描述解釋。後來就以他的名字命名此悖論,即辛普森悖論。

二. 辛普森悖論如何影響民調準確性:假設選戰中只有勢均力敵的甲、乙兩陣營,選前 使用住宅電話和手機做各陣營忠誠度的民意調查時,可能住宅電話和手機民調調 查結果都是甲陣營較忠誠,但是按照各陣營住宅電話和手機使用人口實際加總, 再除以各陣營總人數,算出各陣營忠誠度,卻是乙陣營較忠誠。因此,只是單純 看住宅電話和手機民調調查結果都是甲陣營較忠誠,就會做出甲陣營的人較忠誠 的錯誤結論。

三. 民意調查台灣藍綠忠誠度時發生辛普森悖論的條件探討:

勢均力敵的甲、乙兩陣營,各陣營的每個成員都能藉由 A 種或 B 種兩種互斥民調接受 忠誠度調查,結果如下表:

則當x1 > y1且x2 > y2,z1 < z2,但最後 時,發生辛普森悖論的情形。

發生辛普森悖論的情形時:
幾何分析:當 x1 > y1且 x2 > y2,S=n1+n2=m1+m2

設x1 >x2 時,則有下面幾種可能:

(因為由上述的推論: z1、z2 分別為 x1和x2、y1 和 y2的內分點)

(2)

(3)

則此時發生辛普森悖論z1 < z2的情形,只有(1)這種情況。

即:x1>y1>x2> y2,也就是A 種民調中兩陣營的忠誠度,都高於 B 種民調中兩陣營的忠誠度。
代數分析:當1>y1且x2> y2, S=n1+n2=m1+m2

設x1>x2 時,但最後z1 < z2 ,即:

四. 2016 年當時的選民結構 泛藍、泛綠各自人數: 

全體選民中:泛藍選民占 29%;

泛綠選民占 31.4%;

中立及無反應選民占 39.6%[1]

泛藍、泛綠差距為 2.4%,在誤差範圍內,加上由於當時的社會氣氛,泛藍不表態 的人數較多。 中立及無反應選民中,又有很多隱性的藍綠選民,他們只是口頭表示自己中立,

但內心對政黨的認同度和表態自己是泛藍、泛綠的人相同[2]。考量台灣總統大選,

最後往往是藍綠對決,因此,假設全部選民中,泛藍、泛綠各半。並且,依照當 時紀錄,台灣地區總選民為 1850 萬人。故假設當時泛藍、泛綠各 925 萬人。

泛藍、泛綠各自住宅電話與手機底冊: 

 按照受訪選民電話使用狀況進行劃分時:

P1 代表「唯住宅電話族」

P3 代表「唯手機族」

P2 代表「兩者均用族」

而依據 2016 年台灣總統大選民調推算結果:

泛藍:

P1=5.54%

P2=79.93%

P3=14.53%[1]

泛綠:

P1=7.47%

P2=76.19%

P3=16.34%[1]

研究發現,在考量「樣本涵蓋率」的前提下,若從整體估 計差距的角度觀察,「住宅電話調查為主,唯手機族資料為

輔」應是最佳的組合方式 1 。也就是說,泛藍、泛綠各

自分成二類:「兩者均用族」全部歸給「住宅電話族」一 起調查為一類;另一類為「唯手機族」。 所以,泛藍、泛綠各自住宅電話與手機人數如下:
泛藍:

住宅電話使用人口為 790.6 萬人

唯手機使用人口為 134.4 萬人

泛綠:

住宅電話使用人口為 773.9 萬人

唯手機使用人口為 151.1 萬人

五. 舉例分析: 

針對上面的理論,我們舉一個自己假設的例子。 假設泛藍在住宅電話、手機民調中,忠誠度皆較高, 但是二者人數加總後,再算出的全體忠誠度卻較低:

避免發生辛普森悖論的情形,應該進行的修正:

參、 結論 民意調查,是一門複雜的科學,稍有不注意,可能預測完全失準。由近二十年來,美 國和台灣權威機構的大選民調,紛紛失準,可以窺知一二,而造成失準的原因,其中 之一就是辛普森悖論。因此,在做民調時,要先設計問卷,釐清中間選民,並將各陣 營在各種民調方法的成員數目、成員是否都能藉由互斥的民調方法受到調查,調查清 楚。並且將所得資訊進行修正,才能獲得準確預估的資訊。

參考文獻

  1. 張鐙文、黃東益、洪永泰,”住宅電話與手機雙底冊調查的組合估計:以 2016 總統選舉預測為例”,選舉研究第二十四卷第二期(2017/11)
  2. 劉正山、蔡艾珍,”中間選民的迷失與隱性選民之政黨傾向初探”, 台灣政治學刊第二十卷第二期(2016)
  3. https://zh.wikipedia.org/wiki/%E8%BE%9B%E6%99%AE%E6%A3%AE%E6%82%96%E8%AE%BA