不容政治操弄各說各話 遊行人數科學測算有根有據

50萬、100萬、200萬+1,遊行人數越來越多。「民陣報大數」、「警察報細數」之說不絕於耳。於是有學者「上街」,希望以科學方法,計算出較準確的遊行人數,可是不同機構,計算出來的數字仍有相當大落差。
究竟一個遊行的真實數字真的重要嗎﹖學者坦言遊行生態有助了解社會狀況,而未來在大數據和人工智能的幫助下,數字將會越計越準。

文﹕羅偉健

今年7.1遊行在各種政治的紛紛擾擾下,加上反《逃犯條例》嚴重對立的社會氛圍,究竟會引發多少人上街?這個數字注定會非常矚目,更會受到各方嚴格檢視。7.1遊行的數字一直是各大學術和非學術機構點算人數的「實驗場」,當日民陣號稱遊行人數55萬,警方則公布只有19萬。由「香港發展中心」委託香港科技大學前經濟系主任雷鼎鳴教授作出的估算則為21.5萬;而由港大、美國德州州立大學、AI公司及兩個傳媒機構合作做的統計,則得出24至29萬人;由鍾庭耀主理的「香港民意研究所」得出的數字則有37.4萬人。

不同的數字相差頗大,究竟那一個數字才最準確,相信只有上帝才知道。究竟這些數字是如何估算出來?不同的假設,是否會得出不同的答案?

警方向民陣周日遊行及集會申請發反對通知書。
警方向民陣周日遊行及集會申請發反對通知書。

雷鼎鳴: 面積、密度、梯隊估算

香港科技大學前經濟系主任雷鼎鳴教授,多年來都有為香港的遊行計算人數,他向《堅雜誌》分享了他的計算方法,當中使用的主要有兩種,他會將兩個結果互相引證比較,增加精準度。

第一種方法是流動式,即在遊行路線上設監察點,通常會在天橋上,每人看守一條行車線,以實時點算該站每分鐘或每小時有幾多人走過。第二種方法,是以大量拍照及錄影的方式,將遊行過程拍下來作估算。雷教授表示,有人會認為要以「逐個數」的方法去計算,但問題是數以十萬計的人流是數不出來的,他指全世界都是以簡化及科學的方式去數,就是用算式去算。

這些估算方法的精準程度,主要掌握在三樣數據,即「面積」、「密度」、「梯隊」。面積即遊行街道的總面積;密度是遊行時每平方米所佔人數;至於梯隊,即是遊行的起點至終點都站滿了人為一個梯隊。

按雷教授的算法,只要知道當日總共有幾多「梯隊」,再乘以總面積及密度,即可以得到當天的遊行人數。比如面積為10萬平方米,密度是每平方米2.8人,就會有28萬人。這三者中每一樣都會有變化,比如7.1遊行路線最後臨時改了遮打花園做終點,總路線即長了0.7公里左右。密度方面,不同路段同一位置在不同時間會有不同密度。比如7.1遊行的密度是下午4、5時後才開始增加,而6.16遊行則是「持續高密度」,所以需要大量拍照及錄影才可以加強運算的精準度。

香港科技大學前經濟系主任雷鼎鳴。
香港科技大學前經濟系主任雷鼎鳴。
雷鼎嗚說,有時要以高空拍攝才可以清楚知道遊行中有多少「梯隊」。
雷鼎嗚說,有時要以高空拍攝才可以清楚知道遊行中有多少「梯隊」。

人群數字判斷難 眼見未必為真

雷教授強調,作為一個普通市民的話,有時候未必「見得到真相」,因為單純目測是十分誤導的,即使他們站到天橋高處看,角度也是傾斜的,會看到人與人之間的密度好像好高,但若果真的要看密度:「必須要垂直看,才知道到底有多少空位。」

雷教授說,有時候用手數也會出現問題,比如民陣表示其方法是設監察點,人員每看到十個人就按一次點算機,但這其實很困難,因為太多人,一個人看2至3個人還好,但當一個人看10個人,而且對方不斷移動,時間長了會眼花繚亂,同時亦可能與旁邊的人重疊,重複計算。

另外,雷教授認為最怕的不是中途加入或離開,因為一個地方的密度還是有限的,最大的變數其實是在遊行路線以外的群眾,因為很難得知他們是普通的路人還是遊行人士,所以通常得到的結果都會往上調整。

葉兆輝: 目測配合人工智能判斷

除了雷鼎鳴的團隊外,香港大學社會工作及社會行政學系教授葉兆輝、亦和美國德州州立大學地理學系副教授鄒之喬以及人工智能(AI)公司合作,以傳統目測加電腦人工智能﹙AI﹚點算遊行人數。

據了解,團隊在7.1遊行當日,分成多個小組搜集資料,其中由葉兆輝率領的十多人團隊,分別在軒尼斯道和波斯富街以及軍器廠街兩個觀察點,以目測點算人數。團隊會每分鐘取一次人流實數為基準,再推算整個遊行人數。

同一時間,「AI團隊」則會使用最少7部流動裝置,例如手機及平板電腦,在同一觀測點拍攝遊行情況,再將影像送到電腦系統分析。參與計劃的君宇人工智能有限公司策劃總監黃君保向傳媒表示,這些裝置每1秒垂直向下拍攝3張高清照片,每張圖片成為一個影格(Frame),再由系統辨識出遊行人士,而系統亦會比對不同影格,以便追蹤同一人的步行路徑作核實。

用AI點算遊行人數是新趨勢。
用AI點算遊行人數是新趨勢。

電腦數人頭+ 現場抽查「插隊」人士

為了讓電腦「學習」識別出遊行人士,團隊早將由世界各地拍攝的數萬張公眾場所的人群照片輸入電腦,電腦以深層神經網絡(Deep Neural Network)「學習」,更可從背面「認出」遊行人士,故在遊行時可拍攝遊行人士的背面,以兼顧私隱的考慮。為了增加測量準確度,遊行開始後首半小時,整個團隊會先比對兩組收集回來的數據,以掌握初步可信度。

因應有遊行人士「插隊」,為推算出中途加入的人數,人手統計的團隊再派人在軍器廠街進行問卷抽查,詢問他們的插隊情況,從而推算出插隊人數用以調整總人數估算的偏差,團隊在遊行結束後當晚便可得出估算數字。

學者指點算遊行人數必須知道遊行路線的面積。
學者指點算遊行人數必須知道遊行路線的面積。

數據送美國 德州州立大學再分析

最後,有關數據會交給美國德州州立大學地理學系副教授鄒之喬,他會透過地理資訊系統的虛擬「個體為本模型」(Agent-Based Model),加入遊行人士步行速度等元素,模擬遊行實况,再與當日收集到的數據作比對調整,但或需要數日至數星期才會有最終結果。

結果他們初步計算出,今年7.1遊行人數為26.5萬人,即為民陣公布55萬人的一半,但又較警方稱高峰時有19萬人多約40%。團隊認為當日點算流程順暢,即使有不少市民中途加入,仍已計算在內。

美國德州州立大學地理學系副教授鄒之喬。
美國德州州立大學地理學系副教授鄒之喬。

未來趨勢: 人工智能結合大數據

現時計算遊行人數的方法各有好壞,而最好的方法當然是逐個數,但面對大量群眾,人手點算反而會出現最大落差,所以現時世界各地亦陸續出現用人工智能(AI)幫忙點算,比如用衞星,在高空中拍攝完整照片,精確度可到達2厘米,而電腦即可以在數秒內把圖中人數點算出來,而且電腦的穩定性及精準度都比人類高,相信會成為未來主要的點算工具。

不過,現時這種技術仍未成熟,還是有盲點的存在,比如對「何謂人頭」的辨析,在擠擁的情況下,電腦未必能把人頭和背包區分開來,這需要一個大數據的學習過程,比如給上數以千計的人頭特徵給電腦學習,讓它日後能區分。另外,一但到了夜晚,在漆黑環境中,也可能會影響到電腦的辨析。下雨天時,市民打開雨傘亦有可能令電腦計算不了。

遊行數字是學術更是政治

這些年來,不少學者都努力為遊行數字尋找終極答案,但這些數字意義何在呢﹖中大地理及資源管理學系教授伍美琴說,在沒有民主的地方,遊行生態可以有助了解社會的狀況。而對於AI或進行統計的人來說,遊行本身也是一個跨學科研究的場所。

「試想如果我們的手機統統有我們的行動紀錄,又有各樣信息可供參考,那麼遊行人士的情緒就可以即時分析。遊行對商舖生意的影響和遊行人士身心靈的影響,都可以是大學問!所以不能只看數字。」

李美玲更指出,政治與研究是不可分割的,用「大數據」去研究城市已經是現實,實質上已超越傳統的地理資訊系統﹙GIS﹚,不過「大數據」會引伸出很多私隱和各類社會公義問題,亦是學界需要注意的事。

至於警察方面,過往派員於多個高點觀察,以及點算某一時段在不同區域所聚集人數,從而評估參與人數。警方強調,他們的計算只是一個「粗略估計」數字,旨在保障人群安全及維持人群秩序,若人數遠超場地所容,會按情况實施特別的人群管理措施以作疏導。

伍美琴指計算遊行人數有其重要性。﹙資料圖片﹚
伍美琴指計算遊行人數有其重要性。﹙資料圖片﹚

最新文章