2016年08月16日17:03 來源:天極網(wǎng)T|T
【移動通信網(wǎng)】
8月12日,雷鋒網(wǎng)主辦的“CCF-GAIR全球人工智能與機(jī)器人峰會”于深圳香格里拉大酒店準(zhǔn)時(shí)拉開帷幕。在圓桌討論環(huán)節(jié)“機(jī)器學(xué)習(xí)大浪下進(jìn)擊的巨頭們”中,主辦方邀請到今日頭條科學(xué)家兼頭條實(shí)驗(yàn)室總監(jiān)李磊博士、360人工智能研究院院長顏水成博士等4位專家發(fā)表了對當(dāng)前人工智能領(lǐng)域的專業(yè)見解。擁有兩家科技公司從業(yè)經(jīng)驗(yàn)的科學(xué)家李磊博士,首次公開對前東家百度、現(xiàn)東家今日頭條在人工智能領(lǐng)域研究的看法,并分享了頭條實(shí)驗(yàn)室的最新AI研究成果。
人工智能技術(shù)研發(fā)已成科技大公司「必守陣地」
李磊博士認(rèn)為,百度和今日頭條兩家公司有一個(gè)共同點(diǎn),就是都以人工智能技術(shù)為主的公司。百度在人工智能方面投入非常大,比如語音識別和無人駕駛等。
大家傳統(tǒng)的觀念認(rèn)為今日頭條是新聞客戶端。其實(shí)不然,今日頭條不僅僅是新聞客戶端,是一款基于機(jī)器學(xué)習(xí)的個(gè)性化資訊推薦引擎,是所有信息、內(nèi)容分享創(chuàng)作的平臺。人工智能和機(jī)器學(xué)習(xí)的算法起到了重要作用,能夠幫助高效精準(zhǔn)地把用戶感興趣的內(nèi)容推薦出去。今日頭條的內(nèi)容平臺對應(yīng)著雙邊用戶:一邊是內(nèi)容的創(chuàng)作者,另一邊是內(nèi)容的消費(fèi)者。所以為了把最好的內(nèi)容推薦給最需要的讀者,就需要機(jī)器學(xué)習(xí)的技術(shù)。從這一點(diǎn)上來講這兩家公司都是以人工智能技術(shù)為核心的公司。
講到今日頭條和百度等公司在人工智能領(lǐng)域發(fā)展的不同時(shí),李磊博士坦言,“我覺得主要在發(fā)展階段和體量上是有不同的。百度、谷歌、微軟在深度學(xué)習(xí)領(lǐng)域的探索發(fā)現(xiàn)早、發(fā)展迅速。像微軟在2009年開始研究語音識別技術(shù);谷歌在2012年使用1000臺計(jì)算機(jī)、16000個(gè)CPU做貓臉識別技術(shù);百度則做了深度學(xué)習(xí)研究院,主要研究語音識別和圖象識別技術(shù)。現(xiàn)在百度研究的項(xiàng)目基本同微軟、谷歌一樣多,涉及到了人工智能所有領(lǐng)域!
今日頭條不同于這幾家公司,它于2012年創(chuàng)立,已成立4年;厮菽切╉敿壙萍脊驹诔闪4年時(shí)做什么?facebook在2008年沒有研究院;百度在2003年也沒有實(shí)驗(yàn)室;谷歌在2002年時(shí)做了一個(gè)GFS奠定了搜索的基礎(chǔ)架構(gòu)。今日頭條在成立4年的時(shí)候整個(gè)頭條實(shí)驗(yàn)室團(tuán)隊(duì)就有意識在最前沿技術(shù)上做非常大的投入。在人工智能前沿技術(shù)方面,不管現(xiàn)階段這個(gè)技術(shù)能否投入應(yīng)用,亦或是做技術(shù)儲備做前沿研究,今日頭條在這方面的理念是非常有前瞻性的。
自然語言處理和深度學(xué)習(xí)的進(jìn)步——兼顧寫稿和知識問答的AI機(jī)器人
李磊博士介紹說,他已經(jīng)連續(xù)2年參加國際自然語言大會(ACL),感受最深的是在自然語言處理和理解方面用深度學(xué)習(xí)來作出的成果進(jìn)步非常之大。而且今年幾乎超過2/3的論文都是研究深度學(xué)習(xí)領(lǐng)域。所以如果說我們好像沒有看到深度學(xué)習(xí)在自然語言方面取得像語音技術(shù)和圖像技術(shù)那樣有很大的成功,其實(shí)不然。
當(dāng)然,深度學(xué)習(xí)和自然語言處理在文本方面沒有像語音處理在2009年就成功、像圖像處理在2012年就成功。但現(xiàn)在已經(jīng)有很大的進(jìn)步。在今日頭條的頭條實(shí)驗(yàn)室,我們正在研發(fā)自然問答的機(jī)器人,可以在2200萬的事實(shí)里面準(zhǔn)確率達(dá)到75%,比之前最先進(jìn)的方法準(zhǔn)確率高13%。
為什么能做得這么好?因?yàn)槲覀冇昧烁冗M(jìn)的深度學(xué)習(xí)模型。與此同時(shí),里約奧運(yùn)期間,我們還為機(jī)器人增加了「寫稿」模塊——AI機(jī)器人Xiaomingbot可以自動生成體育新聞報(bào)道,包含簡訊和資訊,過去6天已經(jīng)發(fā)布了200多篇奧運(yùn)新聞,為38萬用戶提供賽果第一時(shí)間的報(bào)道,單篇報(bào)道閱讀量高達(dá)5.5萬。
人工智能研究并不局限于深度學(xué)習(xí)
對于現(xiàn)階段公眾對人工智能研究的認(rèn)識,李磊博士認(rèn)為有必要厘清幾個(gè)常被提到的概念,“大家想到人工智能,不要認(rèn)為人工智能等同于機(jī)器學(xué)習(xí),而機(jī)器學(xué)習(xí)也不等同于深度學(xué)習(xí)!
事實(shí)上,除深度學(xué)習(xí)之外、其他的機(jī)器學(xué)習(xí)框架在歷史上有曾經(jīng)有一段時(shí)間非常成功,甚至現(xiàn)在也有很多的問題可以用其他框架來解決。李磊說,“我們不應(yīng)該把視野僅僅局限于深度學(xué)習(xí)領(lǐng)域上。我們要解決的很多問題比有監(jiān)督學(xué)習(xí)更為復(fù)雜,我們要讓計(jì)算機(jī)去學(xué)習(xí)一些簡單的問題,但是也要讓計(jì)算機(jī)學(xué)會邏輯推理,學(xué)會在復(fù)雜的環(huán)境下如何跟環(huán)境交互,同時(shí)也學(xué)會怎么樣用最少的能量去掌握新的技能!
李磊博士,今日頭條科學(xué)家、頭條實(shí)驗(yàn)室總監(jiān),原百度美國深度學(xué)習(xí)實(shí)驗(yàn)室少帥科學(xué)家。上海交通大學(xué)計(jì)算機(jī)系本科,卡耐基梅隆大學(xué)計(jì)算機(jī)系博士,畢業(yè)論文獲美國計(jì)算機(jī)學(xué)會SIGKDD最佳博士論文之一。曾于微軟研究院、Google、IBMTJWatson、加州大學(xué)伯克利分校工作。在機(jī)器學(xué)習(xí)和自然語言理解方面于國際頂級學(xué)術(shù)會議發(fā)表論文30余篇,擁有三項(xiàng)美國技術(shù)發(fā)明專利。