
【完美網絡世界】新技術能過濾「惡毒的說話」
首先研究團隊分析網站大量的文章和留言,特別是被檢舉的惡意部分,再仔細研究當中重點及通常會與惡意留言一同出現的標點,並從不同方面去理解文字意思。
大家都知廣東話博大精深,有時候的單單打打都不需要用到粗口字詞句。利用文字嵌入技術 (word embedding) ,能更準確理解文字深意,就算每個字分別看起來沒有冒犯的意味,也能推算句子有否惡意成份。
經過測試,團隊的研發成果能90%成功偵測惡意留言。但小編對電腦能否準確理解中文句子是否話中有話(特別是廣東話) 的成功率有保留,畢竟廣東話博大精深,每天被「單打」的大家會懂的。
文章來源:Price.com.hk