“我現(xiàn)在家里有40多個(gè)智能家居。”科大訊飛OS平臺(tái)業(yè)務(wù)部總經(jīng)理林滿佳告訴搜狐科技。即使是作為行業(yè)內(nèi)人士,這個(gè)數(shù)字仍舊讓人驚訝。
林滿佳的情況背后正是當(dāng)下人工智能領(lǐng)域的一大趨勢(shì)——AIoT,其中,智能家居以最先落地的硬件形態(tài)進(jìn)入到普通消費(fèi)者生活中!靶《龋《取薄癏ey,Siri”等喚醒詞已經(jīng)被常常掛在嘴邊。
《IDC中國智能家居設(shè)備市場季度跟蹤報(bào)告》顯示,2019年第一季度中國智能音箱市場出貨量達(dá)到1122萬臺(tái),同比增長787.2%。其中阿里巴巴和百度的出貨量均為340萬臺(tái),小米排在第三,出貨量為290萬臺(tái)。阿里、百度、小米三家占據(jù)了中國智能音箱近86%的出貨量。
智能音箱出貨量暴增,形勢(shì)一片大好。然而從數(shù)據(jù)亦能看出,在這個(gè)成長迅猛,看似藍(lán)海的賽道里,僅剩下幾個(gè)實(shí)力寡頭在競爭。
更值得注意的是,幾家大廠紛紛加碼之時(shí),國內(nèi)最大的智能語音技術(shù)廠商科大訊飛在去年的年度業(yè)績說明會(huì)上,董事長劉慶峰直言“不再跟進(jìn)智能音箱賽道”,并指出從來沒把智能音箱作為智能家居入口。
是巨額補(bǔ)貼傷神,還是需要對(duì)這款智能硬件進(jìn)行重新定位?以家居場景為例,語音在智能音箱這個(gè)話題點(diǎn)的價(jià)值和作用是什么?作為相對(duì)成熟的AI技術(shù)之一,智能語音是否已經(jīng)迎來紅利兌現(xiàn)階段?
搜狐科技“智研所”沙龍第6期特邀請(qǐng)到科大訊飛OS平臺(tái)業(yè)務(wù)部總經(jīng)理林滿佳、標(biāo)貝科技聯(lián)合創(chuàng)始人兼CTO李秀林以及玩秘創(chuàng)始人兼CEO余軻,共同探討智能語音的當(dāng)下和未來。
智能音箱已是紅海?
在80年代,以數(shù)理邏輯為核心的體制瓦解后,人工智能分化出了五大獨(dú)立學(xué)科。在這五大學(xué)科中,由深度學(xué)習(xí)推動(dòng),并順利從科研實(shí)驗(yàn)室走到人們身邊的智能語音,由于是目前落地速度最快、覆蓋率最高的人工智能技術(shù)之一,某種程度上,承擔(dān)了人工智能這兩年的大部分熱度。
據(jù)《IDC中國智能家居設(shè)備市場季度跟蹤報(bào)告》數(shù)據(jù),2019年第一季度中國智能音箱市場出貨量已達(dá)到1122萬臺(tái)。IDC中國助理副總裁王吉平認(rèn)為,智能音箱在中國市場單季度突破1000萬臺(tái)銷量,說明其家庭普及率雖然不及智能手機(jī),但是已經(jīng)和PC、智能電視等產(chǎn)品相當(dāng),且未來可展望的空間將更大。
語音交互技術(shù)是各智能硬件的重要控制手段之一,其中,智能音箱成為最先普及的硬件形態(tài)。
然而,智能音箱經(jīng)歷過三年似過山車一般的發(fā)展歷程后,現(xiàn)在僅留存巨頭競爭,各企業(yè)開始重新審視這一硬件產(chǎn)品的定位。
“為什么智能音箱在西方市場大賣,國內(nèi)大家卻混戰(zhàn)一團(tuán)?”玩秘創(chuàng)始人兼CEO余軻指出這樣一個(gè)現(xiàn)象。雖然中國有人口紅利的優(yōu)勢(shì),但以亞馬遜Echo和Google Home為代表的智能音箱品牌在美國的銷量已經(jīng)遠(yuǎn)超中國市場。
余軻認(rèn)為根本原因根植于中國消費(fèi)者的生活習(xí)慣,“在智能音箱之外,還有一個(gè)不可忽視的智能終端——手機(jī),而相比于音箱,手機(jī)顯然是在近期銷量更大的一種終端,而且其具有用戶隨身攜帶和可移動(dòng)的特性。”
中國用戶更傾向于在路上及戶外的場景消費(fèi)更多內(nèi)容,而不是家里的起居室和臥室。
一個(gè)很直觀的例子是,愛奇藝的用戶有70%都選擇在智能手機(jī)或平板上觀看視頻,而在美國,大多數(shù)Netflix用戶會(huì)端坐在沙發(fā)上通過電視看視頻。
這使得行業(yè)內(nèi)多數(shù)人對(duì)智能音箱這個(gè)賽道仍保持觀望態(tài)度。
(圖片來源:科大訊飛)
針對(duì)國內(nèi)外智能音箱市場的差異,標(biāo)貝科技聯(lián)合創(chuàng)始人兼CTO李秀林認(rèn)為“內(nèi)容”是另一大關(guān)鍵因素。
“如果音箱背后沒有內(nèi)容,只是簡單的交互,是沒有生命力的。內(nèi)容不是憑空來的,需要付費(fèi),但可以發(fā)現(xiàn)中國大家的付費(fèi)意愿普遍不強(qiáng),尤其在互聯(lián)網(wǎng)大潮下,我們之前看的視頻基本都不需要付費(fèi)。但這些年境況已經(jīng)變了,付費(fèi)的意愿有了之后,有人愿意為音箱后面的內(nèi)容付費(fèi),所以也不排除音箱還有更多的發(fā)展機(jī)會(huì)。”李秀林表示。
去年百度開發(fā)者大會(huì)上,“凱叔講故事”正式接入百度DuerOS平臺(tái),也就是說,只要對(duì)著百度智能音箱說凱叔講故事,智能音箱就會(huì)把里面的內(nèi)容推送給你,語音請(qǐng)求和應(yīng)答無縫對(duì)接。
百度智能生活事業(yè)群組(SLG)總經(jīng)理景鯤曾在現(xiàn)場表示:“這是我們對(duì)未來用戶需求的一個(gè)判斷。比如,我只要說‘我想唱歌’,搭載DuerOS的設(shè)備就可以打開‘唱吧’讓你想唱就唱,不需要像在其他設(shè)備上打開特定的APP。說一句‘我想學(xué)英語’,在線少兒英語平臺(tái)VIPKID就會(huì)打開!
與此同時(shí),騰訊聽聽音箱也全力借助自己的內(nèi)容優(yōu)勢(shì),整合了包括QQ音樂、騰訊新聞、企鵝FM、騰訊視頻、閱文集團(tuán)等強(qiáng)大的內(nèi)容體系。
可以說,在智能音箱領(lǐng)域,與其說是對(duì)入口的爭奪,倒不如說是對(duì)場景以及內(nèi)容的爭奪?紤]到智能音箱的技術(shù)難度并不大,而且“再強(qiáng)的技術(shù),也只能領(lǐng)先半年”,技術(shù)和低價(jià)已經(jīng)不再能成為智能音箱競爭的籌碼。
(圖片來源:玩秘)
除此之外,科大訊飛OS平臺(tái)業(yè)務(wù)部總經(jīng)理林滿佳則認(rèn)為,智能音箱只不過是多數(shù)語音廠商賺到的第一桶金,它只是語音交互技術(shù)的突破點(diǎn)之一,不是必由之路!胺謨蓚(gè)場景來看,智能音箱如果用來控制家具,是解決痛點(diǎn),如果作為文娛或信息獲取的工具,那就只是癢點(diǎn)。”
國內(nèi)的語音技術(shù)每項(xiàng)都“差一點(diǎn)”
語音交互主要由三個(gè)環(huán)節(jié)組成:語音合成、語音識(shí)別、語義理解!艾F(xiàn)在大家都知道的一個(gè)共識(shí),國內(nèi)語音識(shí)別技術(shù)準(zhǔn)確率已經(jīng)很高,基本保持在95%-97%的范疇!崩钚懔种赋,各家語音識(shí)別技術(shù)的差別不大,但交互依舊發(fā)展較慢,是因?yàn)橹圃焐虒?duì)用戶需求的理解不成熟,而這方面還需要大量的用戶使用數(shù)據(jù)去支持。
(圖片來源:標(biāo)貝科技)
對(duì)于“95%-97%”這個(gè)數(shù)據(jù),林滿佳提出了不同的看法。
“這個(gè)數(shù)字看起來很美,但我們?cè)谠u(píng)估技術(shù)水平時(shí),需要用乘法法則!绷譂M佳直言,大家都號(hào)稱自己的準(zhǔn)確率這么高,但在工程落地階段,環(huán)節(jié)非常多,從語音交互麥克風(fēng)陣列硬件的設(shè)計(jì)到聲學(xué),再到最后識(shí)別、語義理解到合成,每一步都是要做乘法的,0.98*0.98……,乘下去的數(shù)據(jù)就會(huì)越來越小。
“提高某一方面的算法還是需要繼續(xù)突破的,最重要的是基礎(chǔ)工程方面得去加強(qiáng),中國在聲學(xué)方面還是有點(diǎn)落后的!盙artner分析師特雷西-蔡也曾表達(dá)過類似的觀點(diǎn):“中文自然語言的理解與反饋現(xiàn)在還不成熟,因此人機(jī)對(duì)話還較為蹩腳。”
今年5月,科大訊飛舉行2019年新品發(fā)布會(huì),發(fā)布會(huì)上,科大訊飛一舉發(fā)布了五款A(yù)I+智能硬件,和智能語音云端操作系統(tǒng)iFLYOS的新版本iFLYOS 2.0。
據(jù)林滿佳介紹,iFLYOS的設(shè)計(jì)就是為了滿足人工智能硬件時(shí)代的快速落地。除語音交互人性化及產(chǎn)品設(shè)計(jì)個(gè)性化的特點(diǎn)之外,“硬件要落地快,意味著人工智能每個(gè)硬件針對(duì)性很強(qiáng),所以每個(gè)領(lǐng)域都需要大體不同的一些硬件,所以要求你的落地速度要足夠得快!绷譂M佳介紹,iFLYOS已經(jīng)落地七個(gè)場景,并已經(jīng)全部公開出來。
而行業(yè)內(nèi)另一語音巨頭百度,也在剛過去不久的AI開發(fā)者大會(huì)上展示了“全雙工免喚醒能力”,是小度助手5.0的重要技術(shù)革新。再次突破了人機(jī)語音交互智能程度上限。
除此之外,百度還推出了針對(duì)遠(yuǎn)場語音交互的鴻鵠芯片,可以實(shí)現(xiàn)遠(yuǎn)場陣列信號(hào)實(shí)時(shí)處理,高精度超低誤報(bào)語音喚醒以及離線語音識(shí)別。
各大科技企業(yè)對(duì)語音技術(shù)的價(jià)碼實(shí)際上是對(duì)“超級(jí)入口”的搶奪,但更明顯的是,現(xiàn)在只談?wù)摷夹g(shù)已經(jīng)遠(yuǎn)遠(yuǎn)不夠,還需要大量的用戶數(shù)據(jù)和場景喂養(yǎng)技術(shù),科大訊飛一次性拋出五個(gè)智能硬件的動(dòng)向也可以詮釋這一點(diǎn),C端正在變得越來越重要,從C端實(shí)現(xiàn)盈利,正在變成技術(shù)型公司商業(yè)化的終極夢(mèng)想。