很多技術(shù)本身并不難,難的是技術(shù)之后的大規(guī)模普遍商業(yè)化。
方世彤 獨立新媒體觀察、研究者
“我可以送你回家嗎?”
“太好了,不過我是要坐奔馳車的哦!
“我們?nèi)コ燥埌伞!?/p>
“好的,出門左拐,兩百米外的酸辣粉是我的最愛。如果你用手機簽到,還能打八折!
iPhone 4S上市,大家聽說過、沒玩過的Siri迅速成為眾人調(diào)戲的對象。這樣的用戶體驗確實不錯。一個會聽懂你說話,同時能和你對話的應(yīng)用一下子博得大家的好感。輿論評論說,許多人將會因為這一項應(yīng)用而用iPhone 4S替代iPhone 4。
這一次又是蘋果點燃了這場語音識別的大火。
擁有眾多語音識別方面專利的公司Nuance現(xiàn)在大熱,網(wǎng)上熱傳他們和谷歌,或者蘋果都有緊密的關(guān)系。畢竟人家擁有許多專利,和這些公司在語音方面有交集也非常正!,F(xiàn)在連我們國家的中興通訊也證實正在與Nuance緊密合作。
QQ2011正式推出,其中的輸入法就提供了聽讀,雖然反應(yīng)速度還嫌慢些,但也算是趕上了這個潮流。把早已推出該項技術(shù)的“科大訊飛”的市場之路又給擋住。語音識別算不上什么新鮮的技術(shù),正如觸控當(dāng)初也不算什么新鮮的技術(shù)。李開復(fù)博士曾經(jīng)研發(fā)的Sphinx就是世界上最早的語音識別系統(tǒng)。
但是如果拿原始的那些技術(shù)給消費者,卻是真要折磨死普羅大眾。早先微軟的Windows 7推出,就提出可以使用語音命令。但是由于這項功能挺傻的,誰自言自語工作呢?所以這項功能沒有普及。而在導(dǎo)航儀上能使用語音的功能更是用之者寥寥。只有當(dāng)這些技術(shù)以適應(yīng)普通用戶體驗的方式呈現(xiàn)時,這些技術(shù)才能迅速地普及開來,并深刻地改變某些產(chǎn)品領(lǐng)域。
這是一個古老的命題。改變這一切的還是蘋果,還是喬布斯。借助iPhone 4S“聽說”正在成為一項被市場追捧的,繼觸控之后的又一項超級用戶體驗工具。換句話說,如果不是蘋果和喬布斯將這項十多年前就已經(jīng)出現(xiàn)的技術(shù),運用到淋漓盡致!奥犝f”遠(yuǎn)不會有今天受人追捧的成就。
除此之外,在音樂識別方面,MusicHound是許多音樂愛好者的最愛,這項iPhone和iPad的應(yīng)用能夠識別任意音樂片段,并提供相關(guān)信息及Youtube等網(wǎng)站上的播放鏈接。更妙的是你哼唱的話,它也可以識別。而另一項應(yīng)用Shazam也具備同樣的能力,不一樣的是,人們?yōu)樗鼘ふ业搅伺c聽音樂不一樣的應(yīng)用,并且成功地推向市場。這就是“聽廣告簽到”。Shazam可以聽到廣告內(nèi)容,在識別的過程中,可以為開啟此項應(yīng)用的用戶提供優(yōu)惠券,積分等獎勵。使得這項技術(shù)獲得市場的認(rèn)可,并且得到推廣與普及。
早前一家名為IntoNow的公司推出他們聽聲簽到技術(shù)(即聽電視節(jié)目的聲音實現(xiàn)電視節(jié)目簽到技術(shù))不過三個月就被雅虎公司以迅雷不及掩耳之勢收購。這其實正說明此項技術(shù)正被業(yè)界緊密的關(guān)注,但凡有一點突破和特點,就會被大公司迅速招安。而大公司背后一定是要推出更加符合用戶體驗需求的產(chǎn)品。我們有理由想象這項技術(shù)在廣告方面的作用。它能為廣告主提供精準(zhǔn)的客戶,并進行精準(zhǔn)的B2C營銷服務(wù)。而這里面的價值確實將會是非常龐大的。
在圖形識別技術(shù)方面,人類的研究已經(jīng)快到一個頂點,從早期的條形碼識別,到后來的二維碼識別,再到彩碼識別,識別從有形到無形,幾乎無所不能。而這些的進步無一不是在改善著人們的用戶體驗。而笑臉識別,任意圖形識別,AR技術(shù)都在帶來一些全新的應(yīng)用和人們對看的體驗的革命。聯(lián)想去年和一家國外公司合作推出了肢殘人使用的筆記本電腦,能夠用眼球的運動來控制鼠標(biāo)。這樣的應(yīng)用立時得到市場的積極反應(yīng)。而這樣的技術(shù)也給殘疾人帶來了更好使用電腦的福音。而在近日發(fā)布的安卓4.0更創(chuàng)新地可以實現(xiàn)人臉識別啟動手機的功能。
我們見證的是用戶體驗的不斷被滿足,人機互動越來越流暢。而這些體驗的滿足與不被滿足的界限往往只是在一兩秒之間。如果聽你的聲音,再識別,并能夠回答你的時間過長,你絕對不會喜歡的。但是為了縮短這樣的時間,研發(fā)人員必須要想出許多辦法。而我們以前總說某某技術(shù)不難,我們誰誰都可以做。但是真到了產(chǎn)品階段,卻難以產(chǎn)生令用戶買單的結(jié)果。這顯然正在改變我們的固有思維,正在告訴我們,不成功的原因。
整個IT業(yè)的發(fā)展歷程更像是個人機對話的提升過程,從最早的各種語言程序,到后來的可視化的操作系統(tǒng),再到今天的云計算,圖形及聲音的識別。我們正在用這些人機對話來改善我們在傳統(tǒng)業(yè)務(wù)中的操作。以廣告為例,它將從原來的浪費式刊出形式,轉(zhuǎn)變?yōu)楦尤诵曰馁N身服務(wù)。從Siri聰明的回答中,我們可以想象的是眾多廣告主將要奪取Siri話語權(quán)。