人工智慧偵測仇恨言論的挑戰
2018.09.21
瀏覽數
116
壹、新聞重點
2018年9月11日,Facebook宣布推出新的人工智慧偵測系統「Rosetta」,藉由人工智慧方式識別圖像中的文字內容,有助於分析其中是否涉及仇恨言論,Facebook表示,將透過人工智慧技術主動過濾,而非被動等待用戶檢舉提報。[1] 9月12日,歐盟委員會提出新規則,要求社群媒體平台須在一小時內,刪除有關煽動、提倡極端主義的內容,否則將面臨高達其年度全球營業額4%的罰款,並指出社群媒體平台需採取更為主動積極的措施,例如開發新工具清除濫用訊息。[2]
貳、安全意涵
社群媒體是現今資訊傳遞的重要媒介,挾著這股新興網路傳播力量,針對如宗教、人種、性別、族群或性取向等特定群體,散佈具有煽動、貶抑或威嚇的仇恨言論,正蔓延全球國家社會,挑起社會對立衝突,衝擊社會和諧,成為政府亟需正視的安全議題。
一、限制仇恨言論涉及基本人權
西方民主國家面對仇恨言論引發的安全威脅,仍存有爭議。對於主張加以限制的國家而言,其著眼點在於避免仇恨言論所帶來的影響與傷害,即「第三人效果」傳播理論觀點,因預期傳播訊息對他人會產生高度影響效果,進而促使其採取預防、因應行動。例如德國於2017年通過《社交網路強制法》,規定社群媒體必須在接受使用者通報後的24小時內,撤除明顯違反德國刑法的仇恨言論,這項立法使德國成為打擊社群媒體仇恨言論最為積極與嚴厲的西方民主國家。然而,對於一向捍衛言論自由的美國來說,限制社群媒體仇恨言論的作法,被視為嚴重侵害言論自由的思想控制,並給予社群媒體過分的權力進行內容審查。美國最高法院主張應保障憲法所言的言論自由為首要之務,國家不應過分介入社群媒體言論的價值判斷,否則恐因產生偏見與歧視。因此,美國採取相對寬容的立場,面對仇恨言論的管制。
二、人工智慧偵測社群媒體仇恨言論仍有技術侷限
目前人工智慧偵測仇恨言論,以Twitter為例,透過「自然語言處理」辨識文本內容及「視覺性質識別」辨識圖片與影像,經由監督式深度學習(supervised- Deep Learning),運用「循環神經網絡(recurrent neural networks, RNN)」架構中「長短期記憶-支持向量機器(LSTM-SVM)」網絡模型,對照前後句、前後段落與其他文本進行情緒分析,將內容區分為「非侵犯性侵犯性仇恨性」。[3]
由於仇恨言論定義模糊,導致現有人工智慧偵測系統對仇恨言論的操作型定義不一致。一旦檢視的內容超出訓練範疇,或字句被刻意動手腳,如故意打錯字、添增不相關字眼或改變字距間隔,便可能輕易瞞騙過偵測體系。因此,目前技術若欲達成全自動化偵測仇恨言論,仍有相當差距。以目前Facebook與Instagram所採用的「Rosetta」為例,即使該系統足以同時處理超過10億件不同語言的附圖或影像文字內容,仍需人工進行篩選決策,Facebook便聘僱2萬人進行線上檢查。
參、趨勢研判
一、假新聞製造社群媒體仇恨言論將增加人工智慧偵測難度
偵測仇恨內容與偵測假新聞技術要求規格不盡相同,雖皆為辨識文字與圖或影像,前者經前後文分析,著重情緒辨識與侵犯性分級;後者則注重分辨內容真偽,透過大數據分析比對,追蹤來源真實性以及圖或影像是否經加工修飾。此外,一經辨識確認,處理仇恨言論與假新聞的方式也大相逕庭。仇恨言論多經網路平台予以刪除,而假新聞則按不同性質,可以有刪除、降階(demotion)、威懾,或運用充足的資訊對誤導性內容進行平衡、淡化、轉移(distraction)。因此,若有心人士或團體刻意編織假新聞以製造仇恨言論,即使沒有挑釁或侵犯性字眼,也能以肉搜曝光的個資或羅織的文字或圖像,蓄意煽動實體世界的暴力行為。由於此類網路仇恨言論可能不含挑釁或侵犯性字眼或圖像,僅呈現出羅織編造的文字、圖或影像,因而將大幅增加人工智慧偵測仇恨言論的難度。
社群媒體業者須具備細緻豐富的語言與歷史、社會、文化知識背景,方能同時追查假新聞及審視仇恨言論。以羅興亞遭受種族清洗為例,由於緬甸軍方領袖利用Facebook散佈煽動暴力的仇恨言論與假消息,Facebook坐視不理頻遭指責,雖然Facebook在2018年7月宣示要移除刻意煽動仇恨暴力的假新聞,但卻沒有具體動作,直到聯合國於8月發布報告,指責緬甸軍方對穆斯林少數民族羅興亞人犯下戰爭罪行,Facebook才在8月27日移除18個臉書帳戶和52個臉書專頁,包括緬甸武裝部隊總司令敏昂萊(Min Aung Hlaing)和軍方Myawady電視台的專頁。
二、社群媒體業者會否配合中國處理仇恨言論值得關注
2018年9月10日中國發布《互聯網宗教信息服務管理辦法》,公開徵求意見通知,將著手控管社群媒體宗教資訊,其中宗教資訊規定為「不得利用宗教煽動顛覆國家政權、反對中國共產黨的領導、推翻社會主義制度、分裂國家、破壞國家統一和社會穩定,宣揚極端主義、恐怖主義、民族分裂主義和宗教狂熱。」[4]
乍看之下,前述與中國政府一直以來的網路言論控制並無不同,實質上社群媒體業者若要在中國營運,須配合中國政府審查過濾宗教訊息。由於Google方才傳出意圖重返中國市場,將推動自我審查版本搜尋引擎,而招致各界撻伐。因此,宗教言論會否因被中國政府界定為顛覆、煽動、分裂、宗教狂熱,而被有意在中國發展的社群媒體業者歸類為仇恨言論,使其遭到抵制、刪除,仍有待密切關注。
[1]“Facebook’s new Rosetta AI system helps detect hate speech,” CNET, September 11, 2018, https://www.cnet.com/news/facebooks-new-rosetta-ai-system-helps-detect-hate-speech/
[2]“State of the Union 2018: Commission proposes new rules to get terrorist content off the web,” European Commission, September 12, 2018, http://europa.eu/rapid/press-release_IP-18-5561_en.htm
[3]Georgios Pitsils, Heri Ramampiaro, and Helge Langseth, “Effective hate-speech detection in Twitter data using recurrent neural networks,” Applied Intelligence (forthcoming, October, 2018/first online July 26, 2018), pp. 1-13, https://doi.org/10.1007/s10489-018-1242-y
[4]〈自由再受限 中國擬控管網絡宗教資訊〉,《德國之聲》,2018年9月11日,https://goo.gl/8nDhGz。