蘇南/大數據能神預測誰當選?

利用數據分析選民的不同個性價值觀投票傾向,讓潛在支持者動起來。(圖/視覺中國)

合一選舉只剩12天(11月24日),漫天飛的民調數字會準嗎?不同的媒體、政黨,報導的數據難免會有差別,再加上來亂的大陸網軍,究竟要相信誰呢?

選舉是臺灣政治自由民主、社會開放進步的基石,經濟學人情報社(the Economist Intelligence Unit, EIU)今年1月31日發佈「2017民主指數」,全球民主呈現倒退,而臺灣在全世界排第33名,居東亞第3名,雖屬於「有缺陷民主國家」(lawed democracy),但「選舉過程與多元性」的指標得分高達9.58、「公民自由」達9.12,而「政治參與」僅6.11、「政治文化」則低至5.63(滿分10)。

大數據可以預測選舉結果嗎?2016年的美國大選,印度的人工智慧 (MogIA AI)系統,在選前就已經預測川普會當選總統!11月7日美國期中選舉開票,國會參議院席次共和黨51席(過半)、民主黨42席;衆議院爲民主黨213席(過半)、共和黨190席。而選前的民意調查網站亦顯示,民主黨贏得衆議院的可能性達86%,共和黨守住參議院的機率逾80%,亦即選舉結果與選前預測吻合。

大數據是2010年由IBM所提出,涵蓋4個V:大量化(Volume)、快速化(Velocity)、多樣化(Variety)與真實性(Veracity)。選民的選票可能被大數據「算計」嗎?爭取選票的重點是爭取「中間選民」或「搖擺派」,他們可投可不投,或持觀望態度,或選前最後一天才決定要投給誰。利用大數據分析選民的不同個性及價值觀等投票傾向,運用Facebook或LINE等物聯網結合大數據分析,推送特定心理目標的資訊宣傳詞給特定選民,再通過社交羣組的「按贊」,也能聚「光環效應」,讓潛在支持者動起來。

大數據可以藉網路輿情、媒體傳播及國內外學者之相關研究等,綜合加權預測各候選人的當選機率,但也會因雜訊資料而預測不精確。但大數據相較於民調,除減少人爲操作外,資料可隨時更新即時預測、提高民衆利用的可近性(accessibility)。

大數據預測選情變數包括:候選人勝選機率、網路口碑語意分析)、媒體民調(抽樣調查方法)、羣衆預測(即時交易數據)、口碑傳播力及選民支持力等影響選情的關鍵因素,透過迴歸分析及機器學習法推估當選率,但預測模型的邏輯是前述變數與當選率的相關性,而非因果關係。

選舉大數據須強調完整的選民資料,但「不限於」選民調查樣本來預測當選機率。要提供給大數據的具體或IoT資料包括:1.Facebook、YouTube、新聞媒體、討論區、部落格等網路口碑資料庫;2.媒體調查並公佈的民調報告資料庫;3.未來事件交易所、臺北政治經濟交易等國內民調網站資料;4.歷史選情資料庫(中選會維基百科)等。蒐集資料的方式,也涉及如何詮釋預估得票率及看好度等。但在投票日前10日起至投票時間截止前,不得以任何方式發佈民調資料,亦不得報導、散佈、評論或引述(《公職選罷法》第53條第2項)。

大數據目前預測,臺北市長候選人中的柯文哲、丁守中,當選率領先;選戰激烈的高雄市韓國瑜、陳其邁呈現五五波臺中市林佳龍盧秀燕新北市侯友宜蘇貞昌桃園市鄭文燦臺南市黃偉哲,暫時領先。大數據的預測會依據不同的調查時間、樣本及調查機關等而不同,筆者以爲,大數據選舉預測模型除可大幅減少人爲操作外,也能即時反映選情,去除局部民調的偏誤受訪人樣本不足等,還有不同民調單位常見的預測結果南轅北轍問題

大數據預測也有其黑暗面,例如配合特定候選人操作,企圖操弄選情,另外也要避免因資訊蒐集對民衆隱私權造成威脅,以及防免迷戀資料分析及濫用,以致形成「資料獨裁」或「大數據的傲慢與偏見」。

針對2018年選舉的筆者觀察,經濟選民可能會引導選舉風向,尤其要考慮中產階級的投票傾向,尤其是軍公教年金被砍後的影響。此外,氣候變遷所帶來的跨域治理問題,在非核家園理念下,綠能發電技術是否成熟?前瞻基礎建設的投資效益及乘數效應,是否感動民衆?還有長照2.0的落實、招商促進產業及解決勞工與勞工低薪問題等。

選舉是在看未來,未來的當選人除了要落實政見外,更需要有執行力,千萬不要只是藉選舉來騙選票。期望藉由九合一選舉,選到對的人,也讓人看到臺灣的未來!

好文推薦

蘇南/打擊假新聞卻不打壓言論自由

蘇南/百年老店如何善用AI?智慧運輸成爲臺鐵蛻變契機

蘇南/失速的普悠瑪

●蘇南,國立雲林科技大學營建系及通識教育中心教授,交通大學土木工程博士,中正大學法學博士中國政法大學法學博士。以上言論不代表本公司立場。