臉書用AI對抗仇恨言論見效　主動偵測率攀至97%

2021-06-04 09:37

社群平台臉書（Facebook）今天舉辦亞太區仇恨言論政策線上說明會指出，去年第4季仇恨言論主動偵測率已提升到97.1%，對於未來運用人工智慧（AI）科技偵測仇恨言論將更有信心。

臉書亞太區內容政策經理甘米（Manu Gummi）出席線上說明會表示，處理仇恨言論是一大挑戰，因為仇恨言論沒有全球公認的定義，人們對於仇恨言論的容忍度不同，而且仇恨言論需考量脈絡與情境。臉書的工作是提出能應對全球不同情境，並保障所有人表達自由的方法。

甘米指出，臉書將仇恨言論定義為「針對受保護的特徵，直接攻擊他人」。這個定義是在進行對外大量研究，並諮詢許多獨立專家後得出。受保護的特徵包含種族、國籍、信仰、性別認同等，攻擊則包含非人化的言論（例如將人比喻為動物）、有害的刻板印象、貶低性的陳述、鼓吹排擠或隔離等。

她說，隨著技術進步，臉書在解決平台上的仇恨言論取得重大進展。根據臉書社群守則執行報告，在2019 年12月至2020年12月間，臉書對仇恨言論採取行動的數量攀升近400%。

2017年第4季臉書首度納入仇恨言論衡量數據，當時的主動偵測率為23.6%；這代表臉書移除的仇恨言論中，臉書主動發現而非用戶檢舉的比率是23.6%。在2020年第4季，臉書的主動偵測率攀升至97.1%，可歸功於幾個領域的人工智慧科技發展。

其中一項科技是語言理解，能夠建立機器學習分類器，分析多種語言中的相同概念，在一種語言中的學習成果可以改善在另一種語言中的成效。臉書認為，對於網路上較不常用的語言來說，這項科技格外實用。

另一項科技是全文解讀，也就是從整體角度檢視貼文的能力，包括文字、照片和影片等格式，並同時找出各種違反政策的問題，而不需執行多種分類器。

此外，臉書也運用人工智慧技術，在考量傳播力、嚴重性、違規可能性等因素後，優先處理需要審查的內容。

（中央社）

延伸閱讀