2017年09月06日18:04 來(lái)源:移動(dòng)通信網(wǎng)T|T
【移動(dòng)通信網(wǎng)】【2017年9月4日,北京】9月2日,由IBM和CSDN共同主辦的第三季PowerAI人工智能黑客松編程大賽,在北京成功舉辦。此次賽季以《挖掘制造工藝和流程的金礦》為主題,旨在破解人工智能應(yīng)用難題,推動(dòng)人工智能在傳統(tǒng)制造業(yè)的落地。20個(gè)團(tuán)隊(duì)歷經(jīng)瘋狂、興奮的12個(gè)小時(shí)AI編程比拼,最終來(lái)自中科院聲學(xué)所的4位博士組成的團(tuán)隊(duì)獲得冠軍,第二名由來(lái)自騰訊公司(北京)、中科院自動(dòng)化所的團(tuán)隊(duì)和來(lái)自微軟亞洲研究院、北京大學(xué)的團(tuán)隊(duì)分別獲得,來(lái)自中科院計(jì)算所、北京大學(xué)、北京郵電大學(xué)的團(tuán)隊(duì)和來(lái)自Kavout公司、中科院自動(dòng)化所、中國(guó)科學(xué)院大學(xué)、華通設(shè)計(jì)顧問(wèn)工程有限公司的團(tuán)隊(duì),以及來(lái)自北京希嘉創(chuàng)智教育科技有限公司、上海遠(yuǎn)洲核信、中科院計(jì)算所、中國(guó)科學(xué)院大學(xué)的團(tuán)隊(duì)分獲第三名。
參賽團(tuán)隊(duì)現(xiàn)場(chǎng)大合影
“當(dāng)下,人工智能正處于深耕行業(yè)應(yīng)用的關(guān)鍵點(diǎn),中國(guó)也將人工智能上升為國(guó)家戰(zhàn)略。但把新技術(shù)應(yīng)用到實(shí)踐中,不是一蹴而就的。比如,開(kāi)發(fā)者學(xué)了模型、訓(xùn)練數(shù)據(jù)后,并不一定能真地用在生產(chǎn)線。相信一天的比賽下來(lái),選手們遇到不少挑戰(zhàn),而賽題的設(shè)計(jì)就是一步一步地帶領(lǐng)大家解決這些難題,在其中體驗(yàn)、學(xué)習(xí)人工智能最新的技術(shù),學(xué)會(huì)用人工智能解決行業(yè)中的實(shí)際問(wèn)題。IBM希望通過(guò)舉辦這樣的活動(dòng),發(fā)掘、培養(yǎng)更多人工智能創(chuàng)新人才和團(tuán)隊(duì),共同引領(lǐng)人工智能在行業(yè)實(shí)現(xiàn)新的突破、新的繁榮!盜BM全球副總裁、IBM中國(guó)系統(tǒng)開(kāi)發(fā)中心總經(jīng)理謝東博士表示。
IBM全球副總裁、IBM中國(guó)系統(tǒng)開(kāi)發(fā)中心總經(jīng)理謝東博士
探秘制造業(yè)如何用好AI
制造業(yè)是傳統(tǒng)的企業(yè)。根據(jù)IBM這大半年與包括金融、電信、制造業(yè)、醫(yī)療在內(nèi)的眾多行業(yè)的溝通來(lái)看,制造業(yè)使用AI的意愿非常強(qiáng)。在質(zhì)量控制、流程控制、IOT等方面的數(shù)據(jù)準(zhǔn)備工作已經(jīng)相對(duì)成熟,希望進(jìn)行數(shù)據(jù)分析,直接用到AI技術(shù)。此外,從人工智能應(yīng)用的角度來(lái)說(shuō),真正能產(chǎn)生價(jià)值,能夠改變大家生活的,離不開(kāi)制造業(yè)這種與人們息息相關(guān)的行業(yè)。基于這一背景,此次大賽圍繞人工智能在制造業(yè)的應(yīng)用展開(kāi)。
“AI能為制造業(yè)在質(zhì)量控制、良品率分析、工藝流程的描述這三塊帶來(lái)重要價(jià)值,我們針對(duì)工藝流程方向設(shè)計(jì)了賽題,并將比賽的具體形式設(shè)計(jì)為問(wèn)答系統(tǒng)!盜BM中國(guó)系統(tǒng)實(shí)驗(yàn)室高性能計(jì)算部門(mén)開(kāi)發(fā)部經(jīng)理宋煜進(jìn)一步解釋了賽題的設(shè)計(jì)。
具體而言,現(xiàn)場(chǎng)比賽包含訓(xùn)練環(huán)節(jié)和比賽環(huán)節(jié)。在訓(xùn)練環(huán)節(jié),選手通過(guò)設(shè)計(jì)模型對(duì)給定的語(yǔ)料進(jìn)行分析理解其中語(yǔ)義,最終實(shí)現(xiàn)一個(gè)針對(duì)訓(xùn)練語(yǔ)料內(nèi)容的自動(dòng)問(wèn)答系統(tǒng)。在比賽環(huán)節(jié),選手根據(jù)預(yù)先提供的接口在比賽時(shí)收到以文本形式呈現(xiàn)的題目,然后使用訓(xùn)練好的自動(dòng)問(wèn)答模型回答并通過(guò)提供的接口發(fā)送答案至裁判端。其難點(diǎn)在于準(zhǔn)確判斷問(wèn)題意圖、精準(zhǔn)定位問(wèn)題所在文檔位置以及自動(dòng)抽取并精確組成答案。
為了真正考驗(yàn)選手的能力,題目也做了精心設(shè)計(jì)。IBM花費(fèi)了一個(gè)多月的時(shí)間,收集了醫(yī)療、制造、重工業(yè)、輕工業(yè)等各行各業(yè)的文本資料,還專門(mén)設(shè)計(jì)了三個(gè)大坑:
第一,數(shù)據(jù)沒(méi)有清洗。數(shù)據(jù)大部分都是來(lái)自于標(biāo)準(zhǔn)的PDF、word文檔等,涉及到中文常見(jiàn)的繁體、簡(jiǎn)體問(wèn)題,編碼問(wèn)題,全角、半角的問(wèn)題,為訓(xùn)練過(guò)程設(shè)置了障礙。
第二:特意規(guī)避了一些字詞。這樣選手無(wú)法用關(guān)鍵字、詞和短語(yǔ)來(lái)搜索問(wèn)題的答案。在數(shù)據(jù)沒(méi)有清洗的情況下,如何把Attention模型在12個(gè)小時(shí)內(nèi)做出來(lái),這是最難的考驗(yàn)。
第三:設(shè)置了一些細(xì)節(jié)考核?疾斓臅r(shí)候用了一套AI系統(tǒng)來(lái)評(píng)判,只有最貼近主題的答案才能較高的分?jǐn)?shù)。比如葡萄酒的甜度或酸度,AI系統(tǒng)會(huì)判定用百分比就比要用小數(shù)點(diǎn)更貼近答案主題,也因此能獲得較高分?jǐn)?shù)。
不難看出,比賽形式的設(shè)計(jì)和問(wèn)題題目的設(shè)置,非常貼近AI在制造業(yè)中的實(shí)際應(yīng)用,但難度確實(shí)增大。對(duì)此,中科院聲學(xué)所4位博士組成的冠軍團(tuán)隊(duì)在賽后表示:“比賽中遇到的最難解決的就是數(shù)據(jù)處理的問(wèn)題,沒(méi)有有效的標(biāo)注數(shù)據(jù),幾乎崩潰!但最大的收獲是我們堅(jiān)持了下來(lái),并實(shí)現(xiàn)了完美的團(tuán)隊(duì)合作!”
他們憑什么贏比賽?
IBM中國(guó)系統(tǒng)實(shí)驗(yàn)室高性能計(jì)算部門(mén)開(kāi)發(fā)部經(jīng)理宋煜
賽后,IBM中國(guó)系統(tǒng)實(shí)驗(yàn)室高性能計(jì)算部門(mén)開(kāi)發(fā)部經(jīng)理宋煜表示:“就技術(shù)而言,大賽看重模型的設(shè)計(jì)能力,不只是復(fù)制和使用既有的模型,更重要的是能夠有模型設(shè)計(jì)上的創(chuàng)新。來(lái)自中科院聲學(xué)所的冠軍團(tuán)隊(duì)使用了兩種方案。在最后的方案中使用了Bi-direction LSTM+Attention-LSTM。由于標(biāo)簽數(shù)據(jù)量有限,他們用R-Net的Attention機(jī)制對(duì)問(wèn)題和篇章進(jìn)行表示,然后再次使用Attention-RNN在篇章上進(jìn)行Auto Encoder最后使用帶Attention的Decoder生成答案,替換掉原來(lái)R-Net的輸出層,巧妙降低了標(biāo)簽數(shù)據(jù)不足的影響。同時(shí),在比賽中,該團(tuán)隊(duì)有著良好的項(xiàng)目分工,在轉(zhuǎn)碼,異常字符處理,詞和字的特征提取以及匹配算法上都做了相應(yīng)的調(diào)整和優(yōu)化,最后達(dá)到一個(gè)良好的效果,從而贏得了比賽。”
PowerAI人工智能黑客松備受開(kāi)發(fā)者青睞
事實(shí)上,IBM在技術(shù)、產(chǎn)品化以及跟客戶對(duì)接和項(xiàng)目管理方面都很成熟,而如何用新興的人工智能技術(shù)解決行業(yè)的實(shí)際問(wèn)題,這是IBM關(guān)注的重點(diǎn),也是大賽考核的重點(diǎn)。或許這能解釋為何PowerAI人工智能黑客松備受開(kāi)發(fā)者的青睞。
PoweAI是IBM專門(mén)為人工智能所建,被稱為“世界上最快的商用深度學(xué)習(xí)軟件”,有助于縮短等待時(shí)間、提高生產(chǎn)效率,讓AI開(kāi)發(fā)過(guò)程變得更輕松、更直觀、更高效。
PowerAI人工智能黑客松自今年啟動(dòng)以來(lái),已經(jīng)舉辦過(guò)三季。在前兩季大賽中,開(kāi)發(fā)者給予了大賽熱烈的支持。在大賽第一季中,有113人報(bào)名,58人參賽;而在第二季中,大賽招募參賽人員298人,現(xiàn)場(chǎng)有16支團(tuán)隊(duì)參賽,共計(jì)63人,分別來(lái)自浦發(fā)銀行,交通銀行,興業(yè)數(shù)金,螞蟻金服等金融行業(yè)以及其他服務(wù)于金融行業(yè)的相關(guān)行業(yè)等。
大賽不僅在國(guó)內(nèi)人工智能算法領(lǐng)域引起廣泛關(guān)注,而參賽選手的陣容也堪稱豪華。這一季的選手來(lái)自北大、清華、中科院、北郵、北師大、北航、騰訊、微軟亞洲研究院、搜狗、今日頭條等知名院校及科技公司。這些選手有機(jī)會(huì)接觸最先進(jìn)的PowerAI人工智能平臺(tái),并基于此創(chuàng)建新的計(jì)算機(jī)模型以高效地對(duì)數(shù)據(jù)進(jìn)行分析,類似模型可以在制造業(yè)的新產(chǎn)品設(shè)計(jì)、工藝和流程改進(jìn)等方面幫助設(shè)計(jì)和研究人員更快速借鑒既有經(jīng)驗(yàn),從而加速產(chǎn)品設(shè)計(jì)、工藝和流程改進(jìn)的過(guò)程。
IBM認(rèn)知系統(tǒng)助力人工智能全面落地
事實(shí)上,在認(rèn)知時(shí)代,IBM以PowerAI加速構(gòu)建人工智能生態(tài);诖耍琁BM認(rèn)知系統(tǒng)提供一體化的認(rèn)知基礎(chǔ)架構(gòu)平臺(tái)解決方案,幫助客戶實(shí)現(xiàn)認(rèn)知和人工智能技術(shù)的落地。
IBM認(rèn)知系統(tǒng)借助唯一擁有CPU:GPU NVLink的面向高性能計(jì)算的IBM Power Systems架構(gòu),提供人工智能相關(guān)工作負(fù)載所需的高性能計(jì)算力。此外,認(rèn)知系統(tǒng)集成了PowerAI深度學(xué)習(xí)框架,提供預(yù)編譯的主流深度學(xué)習(xí)軟件工具包,同時(shí)簡(jiǎn)化安裝、部署,并針對(duì)NVIDIA GPU及NVLink優(yōu)化性能。
基于如此強(qiáng)大的軟硬件一體化解決方案,IBM認(rèn)知系統(tǒng)已在金融、醫(yī)療、制造等多個(gè)行業(yè)建立了成熟的應(yīng)用場(chǎng)景。在銀行領(lǐng)域,IBM的智能影像識(shí)別系統(tǒng)可以實(shí)時(shí)檢測(cè)出各種類型的遮擋并進(jìn)行預(yù)警,這對(duì)ATM機(jī)防詐騙有顯著的價(jià)值。在醫(yī)療行業(yè),IBM的認(rèn)知技術(shù)可以幫助醫(yī)生分析醫(yī)學(xué)影像找出病變,提高效率避免遺漏,預(yù)測(cè)和分析腫瘤病例的識(shí)別正確率可達(dá)80%以上。在制造行業(yè),深度學(xué)習(xí)技術(shù)可以輔助零部件與材料缺陷檢測(cè),利用機(jī)器學(xué)習(xí)解決工業(yè)監(jiān)測(cè)/智能制造的應(yīng)用場(chǎng)景。
一個(gè)應(yīng)用案例是石油勘探領(lǐng)域的應(yīng)用公司Stone Ridge采用了30臺(tái)IBM OpenPOWER服務(wù)器、120片GPU,體積大概有會(huì)議桌的一半那么大,在90分鐘時(shí)間內(nèi)就完成了計(jì)算。如果用傳統(tǒng)計(jì)算平臺(tái),使用的機(jī)器的規(guī)模就需要半個(gè)足球場(chǎng)那么大,要跑20個(gè)小時(shí)。
未來(lái),IBM將持續(xù)提升IBM認(rèn)知系統(tǒng)的架構(gòu)能力,為人工智能領(lǐng)域的生態(tài)環(huán)境,提供強(qiáng)有力的技術(shù)支持,加速推動(dòng)人工智能技術(shù)的商業(yè)應(yīng)用。