在以智能音箱“百箱大戰(zhàn)”為代表的AIoT市場火熱的背后,實則是“帶著鐐銬跳舞”,作為業(yè)界翹楚,云知聲給到產業(yè)五把鑰匙。
1
“百箱大戰(zhàn)”下的智能音箱市場滯脹
近日,人工智能算法公司云知聲發(fā)布了基于首款 AIoT 芯片“雨燕”的智能音箱和智能家居解決方案,并宣布將該方案開源。
今年5月,云知聲推出全球首款面向IoT的AI芯片UniOne,在一系列芯片設計中,雨燕是第一代產品,也是第一款面向物聯(lián)網人機交互場景的AI芯片,適用于智能家居和智能音箱領域;在“雨燕”之后,公司表示還將推出面向智能車載領域的第二代芯片“雪豹”,以及用于構建智慧城市的第三代“旗魚”,兩款產品預計將分別于明、后年面世。
“UniOne 雨燕”發(fā)布現(xiàn)場
作為初代,“雨燕”所處的智能家居語音交互市場異?;馃?。此次發(fā)布會上,云知聲副總裁康恒博士這樣描述當前的智能音箱格局:“從2017年開始,有一個現(xiàn)象叫‘百箱大戰(zhàn)’,與之相應的,音箱的解決方案在今年出現(xiàn)了‘百家爭鳴’。”
商戰(zhàn)本為利,AIoT的戰(zhàn)爭也不例外。據相關數(shù)據顯示,僅是中國,2018年智能家居的產業(yè)規(guī)模將達到1800億,兩年之后,這一數(shù)據很可能翻倍,而在2021年,將會達到5000億元。
然而,市場利得并不是那么容易收入囊中。
春秋、戰(zhàn)國可以決出五霸、七雄,但在當今市場經濟和世界貿易的生存規(guī)則下,如果不掌握真正的武功秘籍,那AIoT領域勝出的更有可能是亞馬遜、谷歌、蘋果這些無論端、云、芯都居于世界頂尖的科技巨頭。
在國內智能音箱市場上,“天貓精靈”和“小愛同學”在價格戰(zhàn)上打的火熱,但不知道是否賠本賺吆喝;百度的戰(zhàn)略最初是想收購渡鴉進入高端市場,但在沒有商業(yè)模式的支撐,最終也只能以帶屏的小度在家略顯差異化的進入戰(zhàn)局;作為BAT最后一家,“騰訊聽聽”在千呼萬喚中于今年4月始出來,沒有太多亮點,主打設計和性能,也得到了一些死忠粉的支持。
總體來看,無論是“百箱大戰(zhàn)”還是BAT入局,行業(yè)整體還是呈現(xiàn)出雷聲大、雨點小,并不能讓市場形成消費習慣的滯脹狀態(tài)。
自2012年成立以來持續(xù)在語音交互領域深耕的云知聲,面對如上的市場問題,提出了他們的幾點思考,以及解決方案。
康恒博士整體介紹基于雨燕AIoT 芯片的開源方案
2
定制芯片,用語音交互邏輯解決終端碎片化困境
為什么智能音箱、或者智能家居的概念屬性高于實際價值表現(xiàn)?
康恒首先從IoT的終端呈現(xiàn)出非常明顯的碎片化困境做出解釋:
“物聯(lián)網和傳統(tǒng)互聯(lián)網相比,產品形態(tài)和使用方式都呈現(xiàn)出高度多樣化。在互聯(lián)網時代,終端只有電腦、手機,或者平板。進入IoT時代,產品形態(tài)包括車機、電視、智能音箱、機器人,甚至空調、冰箱、洗衣機、廚電、小家電,所有的設備都可以連接到物聯(lián)網上,產品形態(tài)是高度碎片化和多樣化的。”
在碎片化的終端形態(tài)下,真正能夠體現(xiàn)出產品價值的,除了產品性能,更重要的是連接的性能。簡單說,就是面要大、接口要廣、邏輯要強。
但說起來容易,做起來難。如何能夠讓終端如人腦的神經網絡一般連接?這是一個追求極高速率,但又異常復雜的操作,在康恒看來,唯有芯片可以完成。
“我們把語音交互的邏輯在芯片上得到實現(xiàn)。”
目前,云知聲有專門面向AI的加速器DeepNet,包括面向語音交互、麥克風陣列降噪和處理的數(shù)字信號處理器DSP,以及內置通用ARM核。同時,也在通用CPU上實現(xiàn)了8倍的性能提升。
在專門針對AI的性能設計方面,TTS實現(xiàn)了16倍的速度提升,深度神經網絡則實現(xiàn)了50倍的提升。
在硬件加強和性能提升的基礎上,所有硬件設備實現(xiàn)了感知、表達、思考三個核心方面的增強賦能,同時,將語音交互邏輯放在芯片上得到實現(xiàn)。
技術、產品、服務全棧應對分散供應鏈下的風險
其次,多元化的需求和碎片化的終端,導致了分散的供應鏈。
對此,康恒舉例說明:
“以前,在手機行業(yè)做應用方案,合作的供應鏈除了常規(guī)之外,最重要的只有兩個,一是主控芯片CPU,二是安卓的源代碼和谷歌合作。但對于AIoT來說,則除了芯片、硬件和操作系統(tǒng),還需要增加AI算法、云端,甚至需要把它們打包成應用程序。所以,架構的復雜程度完全不同。”
在應對方式上,云知聲給出的建議是,讓方案商選擇包括技術、產品和服務的全棧式解決方案。
事實上,一個完整的語音交互過程需要前期的語音喚醒、聲紋識別、麥克風陣列、回聲消除等步驟,之后才是語音識別。文字所表達的意圖,則需要由廣義自然語言理解來處理。如果將自然語言理解拓展開來,還要涉及到對話、內容的推介,知識圖譜等非常深厚的技術框架。
在對語音交互技術的復雜性存在普遍的認知盲區(qū)下,康恒指出了一個非常常見的謬誤:“業(yè)界有不少產品商會覺得產品可以自己做,算法公司只需要提供算法,或者引擎就可以。一般這種情況,都是低估了技術架構的復雜度。”
然而,并不是技術全棧之后就可以完全避免風險。
最穩(wěn)妥的方式,還是進一步達成產品和服務的全棧。在達成技術全棧基礎上,產品的全棧要考慮交互、能否量產等問題。而服務的全棧之所以重要,原因在于它可以把技術元素、硬件和生產等元素結合起來,這中間有很多需要協(xié)助客戶完成的工作。
3
優(yōu)化產品體驗需運用工具和SOP提升測試規(guī)范
第三個問題是難以把控的產品體驗。
和考試不一樣,在 AIoT領域,即使產品的每個零部件都是高分性能,它的最終表現(xiàn)有可能是非常低分,這里牽涉屬性沖突的問題。
“真正的好產品不是紙面設計的高大上,而是極佳體驗。各部分零部件的性能磨合非常重要。”康恒表示說。
而性能磨合需要的是不斷的試驗和測試,目前在產業(yè)界,這點做的并不好。不少欠成熟的企業(yè)還是粗放式驗收,“把生產出的音箱擺在測試工位上,然后讓測試員不斷重復歡迎詞和查天氣,類似的驗收方式都是很不正規(guī)的。”
對于如何為客戶提升測試的標準化從而提升產品體驗,云知聲提供了一系列工具,以及SOP,可以把控客戶在測試環(huán)節(jié)的規(guī)范運作。
“比如說,麥克風是否有不良,一致性是不是夠好,裝配之后,結構是否有密封或者振動問題?我們有一系列的工具來幫助大家,無論是IQC或者最后的產測,甚至有一些是自動化的工具。”康恒說。
產品本身性能和團隊協(xié)作決定了產品周期
產品周期對于廠商來說也是一個極大的考驗。
其中,最常見的問題是盲目樂觀,不少廠商自認為做硬件經驗很豐富,做音箱、或智能家居就可以得心應手。
但這個邏輯,在康恒看來是不成立的。
在他看來,實際與產品周期緊密相關的,不是做硬件是否有經驗,或者說企業(yè)的規(guī)模、實力、人數(shù),這些都是邊緣因素。真正起決定性的,一是上述產品本身的性能體驗可以在多長時間內做到極致,二是團隊協(xié)作,在新品的架構上,AI、硬件、軟件和云端服務都需要不斷磨合。
在如何縮短產品周期的問題上,康恒表示云知聲會根據具體服務公司的業(yè)務提供方案。
4
開源代碼設計促進產品實現(xiàn)快速復制
最后一點,是如何能夠在不同的產品之間實現(xiàn)快速復制。
產品形態(tài)的碎片化,導致了方案商在獲得收益方面不能靠單一的產品形態(tài)或者方案獲得滿足,需要考慮不同的應用場景。那么,一個產品的開發(fā)能否用到之前積累的代碼和設計,能否將成功經驗復制到新的產品項目中,對方案公司來說至關重要。
“有時候,這點甚至事關方案公司的生死。”康恒強調說,如果產品之間可以實現(xiàn)快速復制,投入將可以極大減少。
在如何優(yōu)化提升產品復制的問題上,云知聲采用了代碼開源和根據客戶需求完成定制兩種方式。據康恒介紹說,云知聲目前都是開源代碼設計,方案商可以根據需求修改代碼,在云端服務層,會根據客戶的需求,或者具體產品的需求來完成定制的工作。
結語
無論是“百箱大戰(zhàn)”還是“百家爭鳴”,在AIoT大火的背后,終端碎片化、供應鏈分散、產品體驗難提升、產品周期難把控、產品經驗難復制,這五大暗流成為影響產業(yè)良性發(fā)展的重要風險因子,定制芯片,技術、產品、服務全棧,運用工具和SOP,優(yōu)化團隊協(xié)作,開源代碼設計是云知聲給到行業(yè)的五大對策。
雨燕 AIoT 芯片的開源方案現(xiàn)場展示
對于云知聲來說,“雨燕”在智能音箱和智能家居中的應用讓其邁出了馳騁在AIoT領域的第一步,其后的“雪豹”和“旗魚”還將致力于智能汽車和智慧城市。在產業(yè)界,優(yōu)秀的公司會擔綱領導者的角色,它們未來會有怎樣的建樹,“機器人文明”將與您一起持續(xù)關注!