百度王海峰:多模態(tài)深度語義理解將讓AI更深地理解真實世界

相關(guān)專題: 大數(shù)據(jù) 人工智能 芯片

2018年07月05日13:11 來源:互聯(lián)網(wǎng)T|T

【移動通信網(wǎng)】7月4日召開的百度AI開發(fā)者大會(Baidu Create 2018)上,百度高級副總裁、AI技術(shù)平臺體系(AIG)總負(fù)責(zé)人王海峰發(fā)布百度大腦3.0,并指出,百度大腦3.0的核心是“多模態(tài)深度語義理解”,包括數(shù)據(jù)的語義,知識的語義,以及圖像、視頻、聲音、語音等各方面的理解。

多模態(tài)深度語義理解如何在技術(shù)上實現(xiàn)?擁有多大的能量?它將如何被應(yīng)用來改變我們的生活?當(dāng)天下午的百度大腦論壇中,百度大腦3.0的核心技術(shù)一一“亮相”,為開發(fā)者們帶來一場技術(shù)盛宴。

可容納1000人的會場座無虛席,開發(fā)者們甚至席地而坐,或者站在會場最后聽完整場分享。一位開發(fā)者表示,“干貨太多、時間太少,回去要找回放視頻好好消化一下!

從“看清聽清”到“看懂聽懂”

“多模態(tài)深度語義理解能讓機器聽清、看清,更能深入理解它背后的含義,深度地理解真實世界,進(jìn)而更好地支撐各種應(yīng)用!蓖鹾7灞硎尽

視覺語義化可以讓機器從看清到看懂視頻,并提煉出結(jié)構(gòu)化語義知識。百度視覺技術(shù)部、人臉技術(shù)部、增強現(xiàn)實技術(shù)部總監(jiān)吳中勤介紹,視覺語義化技術(shù)首先識別人、物體和場景,同時捕捉它們之間的行為和關(guān)系,通過時序化、數(shù)字化、結(jié)構(gòu)化的方式形成語義知識,最終結(jié)合領(lǐng)域和場景進(jìn)行智慧推理,落地行業(yè)應(yīng)用。比如在零售領(lǐng)域,它可以準(zhǔn)確判斷每個人的動作、行為,真正實現(xiàn)顧客拿起商品就走。未來,視覺語義化技術(shù)還可進(jìn)一步延展,它結(jié)合新型的傳感器和AI芯片,可以在感知層面和計算層面得到大幅提升;結(jié)合手機可以帶給用戶更佳地使用體驗。未來,百度視覺語義化技術(shù)將在百度AI開放平臺中開放給開發(fā)者使用。

語音技術(shù)的升級則讓機器更好地聽懂世界。百度語音技術(shù)部總監(jiān)高亮表示,百度基于遠(yuǎn)場的語音語義一體化技術(shù)取得重大突破,為業(yè)界提供更頂尖的遠(yuǎn)場語音技術(shù)。語音語義一體化將遠(yuǎn)場交互中高頻Query識別準(zhǔn)確率提升10個點,并保持普通Query識別率不降;多語種混合聲學(xué)建;贒eepPeak2大幅提升中英文混合Query識別準(zhǔn)確率,相對錯誤率比業(yè)界最好競品降低20%;新升級的TTS技術(shù)業(yè)界首創(chuàng)傳統(tǒng)拼接技術(shù)與Wavenet技術(shù)融合方案,保證合成質(zhì)量的同時大大降低成本,讓大規(guī)模應(yīng)用落地成為現(xiàn)實。此外,百度重磅發(fā)布遠(yuǎn)場語音技術(shù)低成本解決方案“度小云”,它基于DeepPeakV2語音識別技術(shù)、語音語義一體化技術(shù)及LSTM-VAD深度學(xué)習(xí)語音切分技術(shù),實現(xiàn)業(yè)界領(lǐng)先的五級喚醒技術(shù),并擁有基于Wavenet的精致音庫,支持遠(yuǎn)場優(yōu)化的音頻通信技術(shù)。未來開發(fā)者可以平等便捷地一站式獲取百度遠(yuǎn)場語音能力。

想要讓機器像人一樣擁有智能,將語言變成知識必不可缺。百度AI技術(shù)平臺體系執(zhí)行總監(jiān)吳甜表示,百度自然語言處理技術(shù)經(jīng)過多年的發(fā)展,已形成全面、前沿的格局。百度知識圖譜已發(fā)展為復(fù)雜、多元、全面的多元語義知識圖譜,包含實體圖譜、行業(yè)圖譜、事件圖譜、關(guān)注點圖譜、多媒體圖譜,其中實體圖譜已經(jīng)能夠覆蓋通用需求中90%的實體及其屬性。在閱讀理解技術(shù)上,百度大腦已經(jīng)閱讀了千億量級的文章,相當(dāng)于6萬個中國國家圖書館的藏書,并由此積累了億級實體、千億事實的知識,并通過“學(xué)習(xí)”真實應(yīng)用每天產(chǎn)生的知識不斷優(yōu)化。在對話理解方面,百度理解與交互技術(shù)平臺UNIT升級至2.0,進(jìn)一步增強冷啟動能力,支持像人類一樣在對話當(dāng)中學(xué)習(xí),同時開放了第一個工業(yè)級對話系統(tǒng)開源框架,降低搭建門檻,讓開發(fā)者無縫對接云端。百度將持續(xù)開源新的技術(shù),提供更靈活便捷的方案,推動自然語言理解技術(shù)的創(chuàng)新與發(fā)展。

夯實基礎(chǔ):數(shù)據(jù)、算法、算力并駕齊驅(qū)

數(shù)據(jù)、算法、算力是影響人工智能技術(shù)發(fā)展的重要因素。主論壇中,王海峰表示百度大腦3.0首次將芯片納入技術(shù)體系,帶動百度大腦算力爆發(fā)式增長。百度自主研發(fā)的中國第一款云端全功能AI芯片“昆侖”也在會上首次亮相。未來,AI芯片將與百度自主研發(fā)的PaddlePaddle深度學(xué)習(xí)框架相結(jié)合,推動AI行業(yè)生態(tài)快速發(fā)展。

百度在2016年正式開源的PaddlePaddle,是最適合中國開發(fā)者的深度學(xué)習(xí)框架。主論壇中,王海峰發(fā)布PaddlePaddle3.0,下午,百度AI技術(shù)生態(tài)部總經(jīng)理喻友平對此進(jìn)行了詳細(xì)解讀。PaddlePaddle3.0包括完整的核心框架,以及AIStudio、AutoDL、EasyDL等可以讓開發(fā)者平等便捷獲取頂尖AI能力的平臺。PaddlePaddle3.0核心框架對服務(wù)器版本以及移動端版本進(jìn)行了全面優(yōu)化,PaddlePaddle Fluid提供豐富的滿足常見主流模型搭建需求的API,支持廣泛的模型搭建,訓(xùn)練Runtime可以滿足各類型的模型訓(xùn)練需求;PaddlePaddle Serving可靈活適配多種預(yù)測引擎;PaddlePaddle Mobile集成百度移動端預(yù)測的實踐經(jīng)驗,提供多平臺支持。

PaddlePaddle3.0中,AutoDL備受關(guān)注。百度大數(shù)據(jù)(北京)實驗室主任浣軍介紹,AutoDL能更高效自動搜索神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),開發(fā)者無需特殊硬件設(shè)備可以快速得到高質(zhì)量模型。AutoDL提供多種能力,支持設(shè)計全新深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu),以及優(yōu)化現(xiàn)有深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)及參數(shù),同時能夠適配特定任務(wù)場景。

海量數(shù)據(jù)爆發(fā)式增長,發(fā)掘數(shù)據(jù)價值成為眾多行業(yè)的普遍需求。百度大數(shù)據(jù)部總監(jiān)郭謝表示,百度已形成從數(shù)據(jù)到數(shù)據(jù)工程、數(shù)據(jù)科學(xué)、數(shù)據(jù)產(chǎn)品再到行業(yè)方案的大數(shù)據(jù)產(chǎn)品技術(shù)棧,基于大數(shù)據(jù)特性,從生產(chǎn)資料和生產(chǎn)工具兩方面促進(jìn)產(chǎn)業(yè)發(fā)展。為了最大程度保證數(shù)據(jù)安全,百度正式發(fā)布大數(shù)據(jù)眾智開放平臺“點石”,基于全球領(lǐng)先的百度AI技術(shù),全方位保障數(shù)據(jù)安全,并逐步開放工具能力,為行業(yè)數(shù)據(jù)安全賦能。

現(xiàn)場,百度啟動了多項大賽。百度之星開發(fā)者大賽將如期回歸,此外還有基于PaddlePaddle的中國高校計算機大賽人工智能創(chuàng)意賽、KG-知識抽取賽、交通預(yù)測賽、無人車系列大賽,以及商家招牌的分類與檢測、人工智能加速器應(yīng)用與設(shè)計等大數(shù)據(jù)比賽。百度方面表示,歡迎各路高手挑戰(zhàn),通過大賽攜手推動整個AI產(chǎn)業(yè)的發(fā)展。

業(yè)內(nèi)人士評價,百度在推動技術(shù)落地的同時不斷反哺技術(shù)升級,如今已成為國內(nèi)人工智能領(lǐng)域的領(lǐng)航者。百度大腦升級至3.0,也標(biāo)志著百度AI技術(shù)的一次跨越式升級,正如王海峰在開場中所強調(diào),“百度AI能力的核心是百度大腦,百度大腦3.0是百度AI能力的集大成者。”。基于百度大腦持續(xù)突破的技術(shù)實力,百度有能力把頂尖的AI技術(shù)提供給中國開發(fā)者、企業(yè),更讓每個開發(fā)者和企業(yè)都能平等獲取頂尖AI能力,繼而讓AI在中國遍地開花。


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號,免費領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費領(lǐng)取《中國移動:5G網(wǎng)絡(luò)AI應(yīng)用典型場景技術(shù)解決方案白皮書
  • 2、回復(fù)“5G6G”免費領(lǐng)取《5G_6G毫米波測試技術(shù)白皮書-2022_03-21
  • 3、回復(fù)“YD6G”免費領(lǐng)取《中國移動:6G至簡無線接入網(wǎng)白皮書
  • 4、回復(fù)“LTBPS”免費領(lǐng)取《《中國聯(lián)通5G終端白皮書》
  • 5、回復(fù)“ZGDX”免費領(lǐng)取《中國電信5GNTN技術(shù)白皮書
  • 6、回復(fù)“TXSB”免費領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費領(lǐng)取《中國移動算力并網(wǎng)白皮書
  • 8、回復(fù)“5GX3”免費領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點本月熱點

     

      最熱通信招聘

      最新招聘信息