Facebook副總裁石峰
新浪科技訊 11月17日消息,F(xiàn)acebook副總裁石峰在2016年世界互聯(lián)網(wǎng)大會(huì)上表示,在兩個(gè)星期前剛剛在愛(ài)爾蘭開始測(cè)試了新技術(shù),手機(jī)上將能夠運(yùn)行人工智能,即在Facebook應(yīng)用當(dāng)中推出了神經(jīng)網(wǎng)絡(luò),運(yùn)算都通過(guò)手機(jī)來(lái)完成。
他表示,這些多是現(xiàn)有AI應(yīng)用在圖像視頻識(shí)別、自動(dòng)翻譯等領(lǐng)域做不到的!皩(duì)于人工智能我們要花很長(zhǎng)時(shí)間來(lái)訓(xùn)練它,就像教孩子打棒球一樣。一方面我們有超過(guò)十億人在尋找內(nèi)容,而另外一方面我們又有數(shù)以億計(jì)的內(nèi)容發(fā)布給他們,他們可以很了解這兩者怎么取得平衡,所以我們每天做很多預(yù)測(cè),而真正最激動(dòng)人心的就是我們還能獲得很多反饋”,石峰說(shuō)道。
石峰還透露,F(xiàn)acebook現(xiàn)在已經(jīng)利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)了超過(guò)20個(gè)推理應(yīng)用,比如如何識(shí)別素食與葷食、人戴眼鏡意味著什么、黑客帝國(guó)的能源來(lái)源是什么等等。(李白)
以下是石峰演講實(shí)錄:
大家早上好!我很高興第三次參加世界互聯(lián)網(wǎng)大會(huì),我每年都來(lái),但是我的中文還是很糟糕,我就不為難大家了,我還是用英文演講吧。在我們的工作中,我們覺(jué)得最重要的就是人工智能。接下來(lái)我給大家介紹一下臉譜網(wǎng)公司在人工智能方面的發(fā)展?梢哉f(shuō)人工智能已經(jīng)融入了我們產(chǎn)品的各個(gè)方面,今天給大家舉不少例子,比如說(shuō)人工智能支持著我們的硬件和軟件,最后一部分給大家介紹一下我們最近的研究成果,內(nèi)容就是如何教會(huì)機(jī)器去閱讀文本。
比如我們講新聞推送,我先給大家簡(jiǎn)單介紹一下,每天有十二億的用戶訪問(wèn)臉譜網(wǎng)站,可以說(shuō)他們?cè)谶@里花費(fèi)了很多時(shí)間,而就我們公司而言,我們的工作就是服務(wù)于這十二億人,我們?yōu)樗麄兲峁┝嗽S多故事,我們?yōu)樗麄兲峁┝舜罅康膬?nèi)容。就我們而言,我們的工作就是想要了解用戶究竟想要什么故事,并且將這些內(nèi)容推送給他們。
舉個(gè)例子來(lái)說(shuō),我們了解每個(gè)用戶的興趣,并且向他們提供相關(guān)的內(nèi)容。比如說(shuō)我在烏鎮(zhèn),如果我的太太和孩子發(fā)了照片,內(nèi)容是他們?cè)谂傈S山,我肯定希望她們是我新聞推送的第一條,因?yàn)樗麄兪俏易钤诤醯娜耍宜麄兊牡巧交顒?dòng)也是我的興趣所在。今天能再來(lái)烏鎮(zhèn)我特別高興,我還記得去年烏鎮(zhèn)也是非常精彩。
我們從人工智能的角度來(lái)講講,我想在座的各位都知道人工智能和傳統(tǒng)計(jì)算機(jī)不同,它更像一個(gè)孩子在學(xué)習(xí)這個(gè)世界,而不是事先編程,所以對(duì)于人工智能我們要花很長(zhǎng)時(shí)間來(lái)訓(xùn)練它,就像教孩子打棒球一樣。一方面我們有超過(guò)十億人在尋找內(nèi)容,而另外一方面我們又有數(shù)以億計(jì)的內(nèi)容發(fā)布給他們,他們可以很了解這兩者怎么取得平衡,所以我們每天做很多預(yù)測(cè),而真正最激動(dòng)人心的就是我們還能獲得很多的反饋。
一旦我們向用戶發(fā)布內(nèi)容,我們就知道他們喜歡什么內(nèi)容,了解他們和朋友分享什么,點(diǎn)擊什么內(nèi)容,看什么視頻等等。所以我們每天能夠獲得大量的反饋,在這個(gè)過(guò)程當(dāng)中也可以幫助我們訓(xùn)練系統(tǒng)。所以說(shuō)大家如果是做人工智能的,大家一定覺(jué)得這是再理想不過(guò)的狀況了。除此之外還有兩樣?xùn)|西幫助我們?cè)诂F(xiàn)在獲得成功,我們回到1992年,那個(gè)時(shí)候我剛剛完成我的博士學(xué)位,我的研究當(dāng)中一部分就是人工智能,就我個(gè)人而言,我覺(jué)得1992年還近在眼前,但是實(shí)際上我們看看計(jì)算機(jī)資源在這個(gè)過(guò)程當(dāng)中有了飛躍。
可以說(shuō)如果離開這個(gè)飛躍,我們肯定沒(méi)有辦法處理如今這樣大量海量的數(shù)據(jù)。而且可以說(shuō)更加激動(dòng)人心的是我們?cè)谶@方面真正的取得了進(jìn)展。大家看這張PPT,這張圖表上可以看到智能競(jìng)賽的結(jié)果,在左邊大家可以看到是系統(tǒng)的準(zhǔn)確率,內(nèi)容是辨識(shí)圖像,大家可以看到在四年的時(shí)間當(dāng)中,準(zhǔn)確率從55%上升到了80%,所以說(shuō)是了不起的進(jìn)步啊。大家看這些圓圈,可以看到計(jì)算能力,特別激動(dòng)人心的是最近的系統(tǒng),大家可以看到較之四年前運(yùn)算能力大大提高,接下來(lái)的部分我們來(lái)講講這些技術(shù)對(duì)于我們每天的日;顒(dòng)有什么影響。大家可以看到這里是一些例子,告訴我們?cè)谀樧V上如何解析圖像,并在所有的內(nèi)容當(dāng)中都已經(jīng)融入了人工智能。
接下來(lái)給大家介紹一些圖片和視頻,我想這是最前沿的一部分技術(shù),我想就很多的臉譜的用戶他們有的人在視力上有一些障礙,要想讓他們能夠辨識(shí)圖片,以前他們做不到,現(xiàn)在我們有可能幫忙他們,比如說(shuō)看這里的視頻,我們還能夠讓人來(lái)分析這些圖片。所以說(shuō)如果你是盲人,這毫無(wú)疑問(wèn)是一個(gè)很大的發(fā)展和進(jìn)步。另外我們知道臉譜上一個(gè)內(nèi)容增長(zhǎng)速度很快,就是視頻,在這里我們沒(méi)有把聲音放出來(lái),但是在這里大家可以看到我們進(jìn)行的自動(dòng)的翻譯。大家可以看到底部的文本,就是聲音材料的意思。所以說(shuō)即便不開聲音,仍然可以看字幕知道下面的內(nèi)容是什么。
我們希望能夠幫助所有的人在臉譜上創(chuàng)制更好的視頻,而不僅限于專業(yè)人員,所以說(shuō)非常重要的一門技術(shù)就是視頻穩(wěn)定技術(shù),我們用的就是人工智能技術(shù),這樣即便是普通人也能夠更專業(yè),而且在這個(gè)領(lǐng)域當(dāng)中發(fā)展也很迅速。我們一直都是以人為本,驅(qū)動(dòng)技術(shù),所以說(shuō)我們的技術(shù)最關(guān)心的就是人,在這里是一個(gè)研發(fā)者,他在這里試圖要騙過(guò)相機(jī)。他們的活動(dòng)速度,這個(gè)研發(fā)人員的運(yùn)動(dòng)速度很快,而且不斷地在改變自己的身體姿態(tài),還穿了衣服,我們知道衣服的運(yùn)動(dòng)體態(tài)和人不一樣,有的時(shí)候還調(diào)整顏色和背景色彩,但是即便如此,系統(tǒng)還是能夠迅速辨識(shí),能夠追蹤這個(gè)人的活動(dòng)。就好像最早我們推出照片辨識(shí)的時(shí)候。在兩年半的時(shí)候,我們已經(jīng)達(dá)到了對(duì)面孔辨識(shí)97%的準(zhǔn)確率,現(xiàn)在我們要比人更善于辨識(shí)面孔,而在視頻當(dāng)中我們也是從人臉辨識(shí)開始的。
這是另外的一些例子,也是我們的突破,這是我們?cè)趦蓚(gè)星期前剛剛在愛(ài)爾蘭開始測(cè)試的新技術(shù)。大家可以看到有史以來(lái)第一次可以帶手機(jī)上面運(yùn)行人工智能,究竟這一技術(shù)是什么樣的,就是我們?cè)谀樧V應(yīng)用當(dāng)中推出了神經(jīng)網(wǎng)絡(luò),你只要用手機(jī)拍張照,隨后你可以選一個(gè)著名的藝術(shù)流派濾鏡,之后加上照片就可以形成最后的成果,而且這些都是實(shí)時(shí)的。為什么說(shuō)這些很有意思,因?yàn)檫@一切的過(guò)程和運(yùn)算都是在手機(jī)當(dāng)中進(jìn)行的。一般來(lái)說(shuō)以往需要接入云端獲得計(jì)算能力才能完成。我們現(xiàn)在還是在以原先的方法在繼續(xù)訓(xùn)練我們的系統(tǒng),但是我們現(xiàn)在速度更快,而且只需要手機(jī)的硬件就可以完成原先的運(yùn)算。
為了能夠進(jìn)一步發(fā)展技術(shù),推進(jìn)人工智能,我們也在不斷地發(fā)明新的硬件,這樣的話能夠幫助我們以更快的速度處理更多的數(shù)據(jù),我也非常高興,我們都是開源設(shè)計(jì),最近我們也給九個(gè)不同的國(guó)家,十九個(gè)金融機(jī)構(gòu)提供了支持,從而使這些行業(yè)獲得更快的進(jìn)展,我們給他們提供的就是我們專門設(shè)計(jì)的硬件,我們也非常欣喜能夠幫助所有的方面獲得進(jìn)步。
剛剛給大家分享了具體的例子,告訴我們的產(chǎn)品當(dāng)中的技術(shù),接下來(lái)給大家介紹一下我最感興趣的研究領(lǐng)域,我們的系統(tǒng)可以很有效的告訴大家,左邊是一個(gè)披薩餅,右邊是一個(gè)戴眼鏡的人手里拿著一個(gè)香蕉。但是有兩件事計(jì)算機(jī)做得不太好,一個(gè)就是理解情景和文本,另外一件事就是生產(chǎn)。比如說(shuō)左邊我們問(wèn)計(jì)算機(jī)這是不是一張素食披薩,計(jì)算機(jī)很難回答。右邊問(wèn)這個(gè)人有沒(méi)有2.0的視力,計(jì)算機(jī)也沒(méi)有辦法回答,人是可以回答這些問(wèn)題的。因?yàn)楹芸煸谶@個(gè)問(wèn)題當(dāng)中你就知道,意思是素食不是葷食,一看就知道肯定不是素食。而在右邊一看這個(gè)人戴眼鏡就知道這個(gè)人視力肯定沒(méi)有2.0,但是機(jī)器做不到,我們要怎么做才能讓機(jī)器理解這些文本呢?我們就要著手來(lái)應(yīng)對(duì)這個(gè)問(wèn)題。