2018年05月17日16:55 來源:中國網(wǎng)T|T
【移動通信網(wǎng)】5月16日,今日頭條通過官方微頭條宣布,“靈犬反低俗助手”日前已經(jīng)完成服務升級,新增反色情短文本模型和反謾罵模型,將準確率從73%提升至82%,提高了9個百分點。截至目前,已經(jīng)有超過60萬人次使用“靈犬”小程序,參與打擊低俗,凈化網(wǎng)絡環(huán)境。
這是“靈犬”上線以來,第一次大規(guī)模更新!办`犬”于2018年4月8日正式上線,是國內(nèi)首款人工智能反低俗小程序!办`犬”只需要一段文字或文章鏈接,就能檢測內(nèi)容健康指數(shù),并返回鑒定結(jié)果,包括:是否可以獲得算法推薦,是否需要引入人工判斷等。對于用戶輸入的內(nèi)容,“靈犬”會先進行提取、分詞和語義識別,然后根據(jù)算法規(guī)則,輸出對應的分數(shù)、評級和結(jié)論。這一切,都在短短幾秒內(nèi)完成。
移動互聯(lián)網(wǎng)時代,海量內(nèi)容創(chuàng)作的快速增長,給內(nèi)容識別帶來很大挑戰(zhàn)!伴_放靈犬,是為了匯聚全民力量打擊低俗。我們希望升級服務,更好地幫助用戶檢測低俗信息,共同營造清朗的網(wǎng)絡空間!苯袢疹^條總編輯張輔評稱。
對于人工智能,目前開展反低俗工作至少有三個難點:一是識別“內(nèi)涵色情”,這類場景需要聯(lián)想能力,對機器學習要求很高;二是短文本識別,一般來說,機器接收的上下文、語境越充分,判斷準確度才會越高;三是對書面語和口頭語的分辨,相比規(guī)范的書面語,口頭語很隨意,變化程度大,較難識別。
據(jù)張輔評介紹,為了解決以上難點,“靈犬”制定了專門的低俗分類標準,并新建反色情短文本模型,學習了近萬個標準案例,重點加強對短文本、色情、內(nèi)涵色情的識別,同時注意口語語言和標題語言兩個維度的覆蓋!办`犬”還新建反謾罵模型,加強對謾罵內(nèi)容的識別。
基于人工智能模型的訓練路徑:“收集數(shù)據(jù)-標注樣本-訓練模型”,在反復訓練中,靈犬會變得越來越聰明!办`犬”還設有專門的“反饋有獎”入口,鼓勵網(wǎng)民積極反饋,提供“靈犬”識別不準確的案例或任何改善意見建議,并給予實物獎勵。
今日頭條方面表示,目前在內(nèi)容審核方面,除了配備“靈犬”等,包括色情、低俗、標題黨、虛假信息、低質(zhì)模型在內(nèi)的180多個人工智能模型,今日頭條還投入了6000多人的專業(yè)審核團隊,結(jié)合人工、技術手段,致力于提升內(nèi)容審核的效率和準確度。