內(nèi)容審核的未來靠AI?百度“AI審核員”已練就“火眼金睛”

相關(guān)專題: 大數(shù)據(jù) 人工智能

2018年04月17日14:35 來源:CCTIME飛象網(wǎng)T|T

【移動通信網(wǎng)】近日,F(xiàn)acebook首席執(zhí)行官扎克伯格接受美國國會聽證,引發(fā)全球關(guān)注,會議現(xiàn)場,扎克伯格表示,F(xiàn)acebook希望通過AI來改善內(nèi)容審核,但想要依靠AI審核內(nèi)容可能還需要5-10年。技術(shù)帶來了內(nèi)容生產(chǎn)的去中心化,但面對海量內(nèi)容,如何恰當(dāng)?shù)剡^濾有害信息,營造相對安全、清明的網(wǎng)絡(luò)環(huán)境?月活用戶超過20億的Facebook正面臨著嚴(yán)峻的挑戰(zhàn)。

內(nèi)容審核的問題同樣困擾著國內(nèi)互聯(lián)網(wǎng)公司們;鹕叫∫曨l上的未成年媽媽被推成網(wǎng)紅、B站的科里斯事件暴露的兒童色情問題等等,都提醒國內(nèi)互聯(lián)網(wǎng)平臺,合理合法的內(nèi)容管理越來越必要——今日頭條、快手等平臺近日的困頓,正是源自其對低俗、色情等不健康內(nèi)容管理的失控。

加大審核力度是任何一個內(nèi)容平臺發(fā)展的必須,但雇傭龐大的審核員工卻無疑浪費了技術(shù)的潛力。在不健康內(nèi)容的管理上,百度云的色情識別技術(shù)算得上前輩高手,百度大腦和海量數(shù)據(jù),訓(xùn)練出的模型網(wǎng)絡(luò)層次深、準(zhǔn)確率高,而且響應(yīng)速度很快(毫秒級)。

作為全球最大的中文搜索引擎、重要的信息入口,百度在內(nèi)容管理上的責(zé)任和壓力是巨大的。據(jù)《2017年度信息安全綜合治理報告》顯示,2017全年百度處置有害信息高達451.2億條。支撐龐大的數(shù)字背后。百度將大數(shù)據(jù)、人工智能等核心技術(shù)展開多維度的賦能:利用多項AI技術(shù),如自然語言處理、深度學(xué)習(xí)技術(shù)、圖像識別技術(shù)等搭建內(nèi)容風(fēng)控一體化服務(wù)解決方案,實現(xiàn)對上傳的圖像、文本、視頻等內(nèi)容的有效審核,進行全面內(nèi)容把控,防止多形式的垃圾信息傳播擴散。

圖像識別是百度最具代表性也最易理解的智能審核技術(shù)之一,融合了深度學(xué)習(xí)和圖像識別的綜合性技術(shù),可以快速精準(zhǔn)識別圖片和視頻中的涉黃、涉暴涉恐、政治敏感、微商廣告及令用戶不適的內(nèi)容和事件場景等,已經(jīng)廣泛應(yīng)用于百度網(wǎng)盤、百度貼吧等百度各類內(nèi)容產(chǎn)品中,通過精準(zhǔn)識別審核,大大降低了錯審和漏審風(fēng)險,讓違法違禁內(nèi)容無處可逃。

除了圖像視頻外,用戶評論、聊天內(nèi)容、網(wǎng)絡(luò)文字、注冊信息等文本內(nèi)容也是安全問題的重災(zāi)區(qū),百度文本審核則重點解決這一問題。百度文本審核技術(shù)運用業(yè)界領(lǐng)先的深度學(xué)習(xí)技術(shù),經(jīng)過大規(guī)模樣本訓(xùn)練,可以一站式準(zhǔn)確檢測識別文本中夾雜的色情內(nèi)容、惡意推廣URL、低俗辱罵、政治敏感、暴恐違禁違法等垃圾內(nèi)容,從而自動化、智能化判斷一段文本內(nèi)容是否規(guī)范,極大減少人工審核工作量,降低內(nèi)容風(fēng)險。

當(dāng)然,現(xiàn)階段的“智能”審核也依然需要“人工”的輔助。據(jù)了解,百度每天的推廣內(nèi)容審核數(shù)量高達4.7億條,利用機器系統(tǒng)實現(xiàn)95%以上的信息的審核,并且百度建立了超千人的審查團隊,明確分工,專人專項,形成了“AI技術(shù)防護+嚴(yán)苛人工審核”的模式,嚴(yán)格把控內(nèi)容審核質(zhì)量。

據(jù)百度發(fā)布的《2017年度信息安全綜合治理報告》顯示,全年百度共攔截惡意網(wǎng)頁202.9億個,處置有害信息451.2億條!秷蟾妗窋(shù)據(jù)看,淫穢色情的打擊清理占比67.36%,此外制假販假類、賭博類也分別占9%與7%左右的比例。全方位打擊不良信息,體現(xiàn)了百度對網(wǎng)絡(luò)有害信息的“零容忍”。

好的行業(yè)生態(tài)離不開對標(biāo)準(zhǔn)和價值的堅守,如何讓AI技術(shù)在內(nèi)容審核上更好的發(fā)揮作用,給用戶一個更加安全、健康的網(wǎng)絡(luò)環(huán)境,是每一個互聯(lián)網(wǎng)人應(yīng)該思考的問題。顯然,技術(shù)的潛力還遠未充分發(fā)揮。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費領(lǐng)取《中國電信5GNTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息