華為云人工智能領(lǐng)域首席科學(xué)家田奇:ModelArts+3.0助力行業(yè)AI落地

相關(guān)專題: 人工智能 華為 芯片

在HUAWEI CONNECT 2020期間, 華為云發(fā)布ModelArts 3.0,融合骨干模型、聯(lián)邦學(xué)習(xí)、智能評(píng)估、智能診斷和高效算力。

華為云AI首席科學(xué)家田奇介紹華為云長(zhǎng)期扎根AI基礎(chǔ)技術(shù)研究,覆蓋計(jì)算機(jī)視覺(jué)、語(yǔ)音語(yǔ)義和決策優(yōu)化三大AI領(lǐng)域,提出了六大基礎(chǔ)研究計(jì)劃。這些計(jì)劃產(chǎn)生的許多研究成果以即插即用的方式逐步部署于華為云ModelArts,助力行業(yè)AI落地。

以下是田奇演講全文:

大家好,ModelArts在多個(gè)行業(yè)和項(xiàng)目中有了成功落地,這離不開(kāi)華為云EI在人工智能領(lǐng)域的長(zhǎng)期投入。

華為云長(zhǎng)期扎根AI基礎(chǔ)研究,覆蓋計(jì)算機(jī)視覺(jué)、語(yǔ)音語(yǔ)義和決策優(yōu)化三大領(lǐng)域。我們聚焦于模型高效、數(shù)據(jù)高效、算力高效、知識(shí)高效4大方向,提出了六大基礎(chǔ)研究計(jì)劃,包括面向大模型的模型摸高計(jì)劃、面向小模型的模型瘦身計(jì)劃、面向多模態(tài)學(xué)習(xí)的數(shù)據(jù)魔方計(jì)劃、面向小樣本學(xué)習(xí)的數(shù)據(jù)冰山計(jì)劃、面向通用知識(shí)抽取的萬(wàn)物預(yù)視計(jì)劃和面向新學(xué)習(xí)范式的虛實(shí)合一計(jì)劃。

我們的許多研究成果,包括自動(dòng)機(jī)器學(xué)習(xí)、小樣本學(xué)習(xí)、聯(lián)邦學(xué)習(xí)、預(yù)訓(xùn)練模型等,能夠即插即用地部署于ModelArts使能平臺(tái),助力AI賦能千行百業(yè)。

在多項(xiàng)業(yè)界公開(kāi)競(jìng)賽和測(cè)評(píng)中,華為云EI的持續(xù)創(chuàng)新研究已經(jīng)取得了不錯(cuò)的成果,這些都將應(yīng)用于ModelArts平臺(tái),提供給全球的開(kāi)發(fā)者使用。

感知方面,我們?cè)贗mageNet大規(guī)模圖像分類、WebVision大規(guī)模網(wǎng)絡(luò)圖像分類、MS-COCO二維物體檢測(cè)、nuScenes三維物體檢測(cè)、視覺(jué)預(yù)訓(xùn)練模型的下游 分類/檢測(cè)/分割等驗(yàn)證中,均保持業(yè)界領(lǐng)先。目前,ModelArts驅(qū)動(dòng)的感知模型已經(jīng)在醫(yī)療影像分析、油氣勘探、工業(yè)故障檢測(cè)等領(lǐng)域獲得廣泛應(yīng)用。

認(rèn)知方面,依托語(yǔ)音語(yǔ)義和知識(shí)圖譜方向的積累,我們整合行業(yè)數(shù)據(jù),對(duì)多樣、復(fù)雜、孤島化的數(shù)據(jù)進(jìn)行治理,實(shí)現(xiàn)感知智能到認(rèn)知智能的飛躍。目前,ModelArts驅(qū)動(dòng)的認(rèn)知模型已在藥物靶點(diǎn)預(yù)測(cè)、金融詐騙分析、智能售后客服等多項(xiàng)任務(wù)中得到應(yīng)用。

決策方面,依托運(yùn)籌優(yōu)化、強(qiáng)化學(xué)習(xí)、智能控制等算法,我們已經(jīng)構(gòu)建起完整的決策底座,使得AI真正實(shí)現(xiàn)感知-認(rèn)知-決策的智能閉環(huán)。目前,ModelArts驅(qū)動(dòng)的決策引擎已經(jīng)應(yīng)用于機(jī)位分配、工業(yè)制造、智能交通、游戲娛樂(lè)等領(lǐng)域。

我們發(fā)布的ModelArts3.0,是面向AI在行業(yè)落地提供的AI開(kāi)發(fā)平臺(tái)。在這里,我和我的團(tuán)隊(duì)主要是從技術(shù)領(lǐng)域進(jìn)行探索和研究,如何通過(guò)AI技術(shù)高效解決行業(yè)挑戰(zhàn),比如,如何用極少數(shù)據(jù)訓(xùn)練出高精度模型?如何降低企業(yè)應(yīng)用AI的門檻?如何解決企業(yè)對(duì)數(shù)據(jù)安全使用的顧慮等?最終,我們將骨干模型、聯(lián)邦學(xué)習(xí)、智能診斷評(píng)估優(yōu)化、和高效算力,很好的融入了ModelArts3.0,下面我將詳細(xì)解讀。

華為云骨干工具鏈EI-Backbone,整合模型高效、數(shù)據(jù)高效、算力高效、知識(shí)高效,全面提升行業(yè)AI落地能力。EI-Backbone的能力,已經(jīng)在10余個(gè)行業(yè)成功驗(yàn)證,并且斬獲10余個(gè)業(yè)界挑戰(zhàn)賽冠軍,發(fā)表100余篇頂級(jí)論文。EI-Backbone提供了AI開(kāi)發(fā)的新范式,以肺部醫(yī)療影像分割為例來(lái)介紹:

過(guò)去需要成百上千例標(biāo)注數(shù)據(jù)才能進(jìn)行的訓(xùn)練,現(xiàn)在有了EI-Backbone,只需要幾十例甚至十幾例標(biāo)注數(shù)據(jù)即可完成,節(jié)省標(biāo)注成本90%以上;

過(guò)去需要大量專家經(jīng)驗(yàn)和試錯(cuò)成本的模型選擇和超參調(diào)節(jié),通過(guò)EI-Backbone提供的全空間網(wǎng)絡(luò)架構(gòu)搜索和自動(dòng)超參優(yōu)化技術(shù),可在無(wú)需人工干預(yù)的情況下快速完成,且精度大幅提升;

過(guò)去需要幾周甚至更長(zhǎng)時(shí)間,從頭開(kāi)始的模型訓(xùn)練、測(cè)試、驗(yàn)收和部署流程,在加載EI-Backbone集成的預(yù)訓(xùn)練模型后,可以縮短到幾小時(shí)甚至幾分鐘內(nèi)完成,訓(xùn)練成本降低90%以上。

基于EI-backbone技術(shù),我們?nèi)A為云ModelArts和杭州云深處科技有限公司合作,實(shí)現(xiàn)了四足機(jī)器狗的工業(yè)場(chǎng)景巡檢。

華為云ModelArts 3.0的下一個(gè)特性--聯(lián)邦學(xué)習(xí)。

眾所周知,數(shù)據(jù)是AI應(yīng)用的基礎(chǔ),只有基于多樣化的數(shù)據(jù),才能實(shí)現(xiàn)AI智能感知。然而,在實(shí)際AI行業(yè)落地中,數(shù)據(jù)是分散在不同的數(shù)據(jù)控制者之間,這就導(dǎo)致了行業(yè)應(yīng)用的數(shù)據(jù)孤島問(wèn)題,使得AI算法訓(xùn)練效果受到限制。

針對(duì)這個(gè)問(wèn)題,華為云Modelarts提供聯(lián)邦學(xué)習(xí)特性,實(shí)現(xiàn)數(shù)據(jù)不出戶的聯(lián)合建模。用戶各自利用本地?cái)?shù)據(jù)訓(xùn)練,不交換數(shù)據(jù)本身,只用加密方式交換更新的模型參數(shù),實(shí)現(xiàn)協(xié)同訓(xùn)練。

華為云EI與中國(guó)科學(xué)院上海藥物所的蔣華良院士合作,將華為自研的FedAMP算法和AutoGenome算法應(yīng)用到藥物研發(fā)的AI任務(wù)中,精準(zhǔn)預(yù)測(cè)藥物水溶解性、心臟毒性和激酶活性,準(zhǔn)確度遠(yuǎn)超傳統(tǒng)的聯(lián)邦學(xué)習(xí)和深度學(xué)習(xí)算法。

此外,華為云提供云邊協(xié)同的服務(wù),支持不同地點(diǎn)、不同客戶的數(shù)據(jù)進(jìn)行聯(lián)邦訓(xùn)練,通過(guò)加密方式上傳服務(wù)端,對(duì)全局模型進(jìn)行更新,再將其下發(fā)至邊緣設(shè)備,便捷支持同業(yè)態(tài)的橫向聯(lián)邦和跨業(yè)態(tài)的縱向聯(lián)邦學(xué)習(xí)。聯(lián)邦訓(xùn)練參與者可以通過(guò)云端,也可以通過(guò)華為云邊緣設(shè)備(如智能小站)的計(jì)算能力參與聯(lián)邦訓(xùn)練,實(shí)現(xiàn)行業(yè)內(nèi)聯(lián)合建模。

模型在部署上線前,需要進(jìn)行充分評(píng)估,結(jié)果優(yōu)秀的模型直接投入生產(chǎn)環(huán)境,差強(qiáng)人意的則需要進(jìn)一步優(yōu)化迭代。ModelArts提供了全面的可視化評(píng)估、智能化診斷功能,使得開(kāi)發(fā)者可以直觀的了解模型的各方面性能,進(jìn)而針對(duì)性的進(jìn)行調(diào)優(yōu)或部署生產(chǎn)。

下面以一個(gè)上皮病變細(xì)胞分類的模型評(píng)估來(lái)進(jìn)行詳細(xì)講解。

在精度方面,華為云ModelArts提供了包含準(zhǔn)確率、精確率、召回率、F1值、混淆矩陣、ROC曲線等常規(guī)指標(biāo),還包括了數(shù)據(jù)敏感度分析模塊,評(píng)估模型在不同數(shù)據(jù)特征子區(qū)間上的表現(xiàn);

在性能方面,ModelArts提供算子級(jí)別的時(shí)間、空間消耗統(tǒng)計(jì)分析和多種整體的性能指標(biāo),并且針對(duì)模型的表現(xiàn)給出相應(yīng)建議,如模型量化、蒸餾等;

在可解釋性方面,ModelArts提供熱力圖,用以展示模型做出推理判斷所依據(jù)的區(qū)域;

在可信方面,ModelArts內(nèi)置多種模型可信相關(guān)評(píng)測(cè)方法,提供多角度模型安全能力評(píng)估指標(biāo),并能依據(jù)當(dāng)前模型表現(xiàn)給出相應(yīng)的防御建議。

隨著深度學(xué)習(xí)分布式訓(xùn)練的不斷發(fā)展,各類模型的訓(xùn)練對(duì)于計(jì)算設(shè)備的需求越來(lái)越大。但由于各種原因,訓(xùn)練作業(yè)的資源還沒(méi)有被充分利用。造成資源浪費(fèi)的原因非常多,主要包括以下幾點(diǎn):

訓(xùn)練算法代碼本身質(zhì)量不高、資源利用率低。

模型大小和超參數(shù)的設(shè)置也會(huì)顯著地改變計(jì)算資源的利用率。

資源池整體利用率存在波動(dòng)峰谷。類似于“峰谷電”,訓(xùn)練作業(yè)的提交也有高峰期和低谷期,造成很大的資源浪費(fèi)。

彈性訓(xùn)練是ModelArts的核心能力之一,可以根據(jù)模型訓(xùn)練速度的需求自適應(yīng)實(shí)現(xiàn)資源的最佳分配。

ModelArts提供兩種模式,一是Turbo模式,可以充分利用空閑資源加速已有訓(xùn)練作業(yè),訓(xùn)練速度可提升10倍以上,并且不影響模型的收斂精度;二是經(jīng)濟(jì)模式,可以通過(guò)最大化資源利用率給開(kāi)發(fā)者提供極致的性價(jià)比,在大多數(shù)典型場(chǎng)景下可以提升性價(jià)比30%以上。

為了更好地支持超大算力需求的AI研發(fā),華為ModelArts平臺(tái)在集群規(guī)模,任務(wù)數(shù)量,以及分布式訓(xùn)練都做了針對(duì)性的優(yōu)化。

ModelArts研發(fā)平臺(tái)能夠管理上萬(wàn)的節(jié)點(diǎn),更好的支持大型訓(xùn)練任務(wù)需求。通過(guò)優(yōu)化服務(wù)框架,ModelArts平臺(tái)支持10萬(wàn)級(jí)別的作業(yè)同時(shí)運(yùn)行、支持萬(wàn)級(jí)芯片的大規(guī)模分布式任務(wù)。

優(yōu)秀的分布式加速比是大規(guī)模集群分布式訓(xùn)練的關(guān)鍵能力,也是促使用戶選擇使用大規(guī)模集群來(lái)加速AI業(yè)務(wù)的關(guān)鍵因素。

華為云ModelArts領(lǐng)先的分布式加速比能力,在MLPerf benchmark Imagenet-1K分類任務(wù)上,使用512芯片集群跑出93.6秒的成績(jī),優(yōu)于NVIDIA V100的120秒。

在骨干網(wǎng)絡(luò)、聯(lián)邦學(xué)習(xí)、模型診斷優(yōu)化、高效算力的加持下,華為云ModelArts會(huì)加速AI在行業(yè)落地。未來(lái),華為云將持續(xù)聚焦于模型高效、數(shù)據(jù)高效、算力高效和知識(shí)高效4個(gè)重點(diǎn)方向,扎根于AI基礎(chǔ)研究。在計(jì)算機(jī)視覺(jué)、語(yǔ)音語(yǔ)義、決策優(yōu)化3大AI領(lǐng)域進(jìn)行基礎(chǔ)研究計(jì)劃投入,我們會(huì)持續(xù)努力,提供強(qiáng)大的AI技術(shù)支持每一位開(kāi)發(fā)者發(fā)揮所長(zhǎng)、創(chuàng)造獨(dú)特價(jià)值。華為云將持續(xù)踐行普惠AI,與全球開(kāi)發(fā)者共成長(zhǎng)!

謝謝大家!


微信掃描分享本文到朋友圈
掃碼關(guān)注5G通信官方公眾號(hào),免費(fèi)領(lǐng)取以下5G精品資料
  • 1、回復(fù)“YD5GAI”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):5G網(wǎng)絡(luò)AI應(yīng)用典型場(chǎng)景技術(shù)解決方案白皮書(shū)
  • 2、回復(fù)“5G6G”免費(fèi)領(lǐng)取《5G_6G毫米波測(cè)試技術(shù)白皮書(shū)-2022_03-21
  • 3、回復(fù)“YD6G”免費(fèi)領(lǐng)取《中國(guó)移動(dòng):6G至簡(jiǎn)無(wú)線接入網(wǎng)白皮書(shū)
  • 4、回復(fù)“LTBPS”免費(fèi)領(lǐng)取《《中國(guó)聯(lián)通5G終端白皮書(shū)》
  • 5、回復(fù)“ZGDX”免費(fèi)領(lǐng)取《中國(guó)電信5GNTN技術(shù)白皮書(shū)
  • 6、回復(fù)“TXSB”免費(fèi)領(lǐng)取《通信設(shè)備安裝工程施工工藝圖解
  • 7、回復(fù)“YDSL”免費(fèi)領(lǐng)取《中國(guó)移動(dòng)算力并網(wǎng)白皮書(shū)
  • 8、回復(fù)“5GX3”免費(fèi)領(lǐng)取《R1623501-g605G的系統(tǒng)架構(gòu)1
  • 本周熱點(diǎn)本月熱點(diǎn)

     

      最熱通信招聘

      最新招聘信息