131 1300 0010
行業(yè)動態(tài)
當(dāng)前位置: 首頁>> 新聞中心>>行業(yè)動態(tài)>>
  • 導(dǎo)航欄目
  • 產(chǎn)品新聞
  • 企業(yè)新聞
  • 行業(yè)動態(tài)
  • 面向未來AI世界,做當(dāng)下觀察、思考和感悟的“機
    面向未來AI世界,做當(dāng)下觀察、思考和感悟的“機
  • 面向未來AI世界,做當(dāng)下觀察、思考和感悟的“機
  •   發(fā)布日期: 2018-09-17  瀏覽次數(shù): 1,291

    在以智能音箱“百箱大戰(zhàn)”為代表的AIoT市場火熱的背后,實則是“帶著鐐銬跳舞”,作為業(yè)界翹楚,云知聲給到產(chǎn)業(yè)五把鑰匙。

    1

     

    “百箱大戰(zhàn)”下的智能音箱市場滯脹

    近日,人工智能算法公司云知聲發(fā)布了基于首款 AIoT 芯片“雨燕”的智能音箱和智能家居解決方案,并宣布將該方案開源。

    今年5月,云知聲推出全球首款面向IoT的AI芯片UniOne,在一系列芯片設(shè)計中,雨燕是第一代產(chǎn)品,也是第一款面向物聯(lián)網(wǎng)人機交互場景的AI芯片,適用于智能家居和智能音箱領(lǐng)域;在“雨燕”之后,公司表示還將推出面向智能車載領(lǐng)域的第二代芯片“雪豹”,以及用于構(gòu)建智慧城市的第三代“旗魚”,兩款產(chǎn)品預(yù)計將分別于明、后年面世。

    “UniOne 雨燕”發(fā)布現(xiàn)場

    作為初代,“雨燕”所處的智能家居語音交互市場異?;馃帷4舜伟l(fā)布會上,云知聲副總裁康恒博士這樣描述當(dāng)前的智能音箱格局:“從2017年開始,有一個現(xiàn)象叫‘百箱大戰(zhàn)’,與之相應(yīng)的,音箱的解決方案在今年出現(xiàn)了‘百家爭鳴’。”

    商戰(zhàn)本為利,AIoT的戰(zhàn)爭也不例外。據(jù)相關(guān)數(shù)據(jù)顯示,僅是中國,2018年智能家居的產(chǎn)業(yè)規(guī)模將達(dá)到1800億,兩年之后,這一數(shù)據(jù)很可能翻倍,而在2021年,將會達(dá)到5000億元。

    然而,市場利得并不是那么容易收入囊中。

    春秋、戰(zhàn)國可以決出五霸、七雄,但在當(dāng)今市場經(jīng)濟和世界貿(mào)易的生存規(guī)則下,如果不掌握真正的武功秘籍,那AIoT領(lǐng)域勝出的更有可能是亞馬遜、谷歌、蘋果這些無論端、云、芯都居于世界頂尖的科技巨頭。

    在國內(nèi)智能音箱市場上,“天貓精靈”和“小愛同學(xué)”在價格戰(zhàn)上打的火熱,但不知道是否賠本賺吆喝;百度的戰(zhàn)略最初是想收購渡鴉進(jìn)入高端市場,但在沒有商業(yè)模式的支撐,最終也只能以帶屏的小度在家略顯差異化的進(jìn)入戰(zhàn)局;作為BAT最后一家,“騰訊聽聽”在千呼萬喚中于今年4月始出來,沒有太多亮點,主打設(shè)計和性能,也得到了一些死忠粉的支持。

    總體來看,無論是“百箱大戰(zhàn)”還是BAT入局,行業(yè)整體還是呈現(xiàn)出雷聲大、雨點小,并不能讓市場形成消費習(xí)慣的滯脹狀態(tài)。

    自2012年成立以來持續(xù)在語音交互領(lǐng)域深耕的云知聲,面對如上的市場問題,提出了他們的幾點思考,以及解決方案。

    康恒博士整體介紹基于雨燕AIoT 芯片的開源方案

    2

    定制芯片,用語音交互邏輯解決終端碎片化困境

    為什么智能音箱、或者智能家居的概念屬性高于實際價值表現(xiàn)?

    康恒首先從IoT的終端呈現(xiàn)出非常明顯的碎片化困境做出解釋:

    “物聯(lián)網(wǎng)和傳統(tǒng)互聯(lián)網(wǎng)相比,產(chǎn)品形態(tài)和使用方式都呈現(xiàn)出高度多樣化。在互聯(lián)網(wǎng)時代,終端只有電腦、手機,或者平板。進(jìn)入IoT時代,產(chǎn)品形態(tài)包括車機、電視、智能音箱、機器人,甚至空調(diào)、冰箱、洗衣機、廚電、小家電,所有的設(shè)備都可以連接到物聯(lián)網(wǎng)上,產(chǎn)品形態(tài)是高度碎片化和多樣化的。”

    在碎片化的終端形態(tài)下,真正能夠體現(xiàn)出產(chǎn)品價值的,除了產(chǎn)品性能,更重要的是連接的性能。簡單說,就是面要大、接口要廣、邏輯要強。

    但說起來容易,做起來難。如何能夠讓終端如人腦的神經(jīng)網(wǎng)絡(luò)一般連接?這是一個追求極高速率,但又異常復(fù)雜的操作,在康恒看來,唯有芯片可以完成。

    “我們把語音交互的邏輯在芯片上得到實現(xiàn)。”

    目前,云知聲有專門面向AI的加速器DeepNet,包括面向語音交互、麥克風(fēng)陣列降噪和處理的數(shù)字信號處理器DSP,以及內(nèi)置通用ARM核。同時,也在通用CPU上實現(xiàn)了8倍的性能提升。

    在專門針對AI的性能設(shè)計方面,TTS實現(xiàn)了16倍的速度提升,深度神經(jīng)網(wǎng)絡(luò)則實現(xiàn)了50倍的提升。

    在硬件加強和性能提升的基礎(chǔ)上,所有硬件設(shè)備實現(xiàn)了感知、表達(dá)、思考三個核心方面的增強賦能,同時,將語音交互邏輯放在芯片上得到實現(xiàn)。

    技術(shù)、產(chǎn)品、服務(wù)全棧應(yīng)對分散供應(yīng)鏈下的風(fēng)險

    其次,多元化的需求和碎片化的終端,導(dǎo)致了分散的供應(yīng)鏈。

    對此,康恒舉例說明:

    “以前,在手機行業(yè)做應(yīng)用方案,合作的供應(yīng)鏈除了常規(guī)之外,最重要的只有兩個,一是主控芯片CPU,二是安卓的源代碼和谷歌合作。但對于AIoT來說,則除了芯片、硬件和操作系統(tǒng),還需要增加AI算法、云端,甚至需要把它們打包成應(yīng)用程序。所以,架構(gòu)的復(fù)雜程度完全不同。”

    在應(yīng)對方式上,云知聲給出的建議是,讓方案商選擇包括技術(shù)、產(chǎn)品和服務(wù)的全棧式解決方案。

    事實上,一個完整的語音交互過程需要前期的語音喚醒、聲紋識別、麥克風(fēng)陣列、回聲消除等步驟,之后才是語音識別。文字所表達(dá)的意圖,則需要由廣義自然語言理解來處理。如果將自然語言理解拓展開來,還要涉及到對話、內(nèi)容的推介,知識圖譜等非常深厚的技術(shù)框架。

    在對語音交互技術(shù)的復(fù)雜性存在普遍的認(rèn)知盲區(qū)下,康恒指出了一個非常常見的謬誤:“業(yè)界有不少產(chǎn)品商會覺得產(chǎn)品可以自己做,算法公司只需要提供算法,或者引擎就可以。一般這種情況,都是低估了技術(shù)架構(gòu)的復(fù)雜度。”

    然而,并不是技術(shù)全棧之后就可以完全避免風(fēng)險。

    最穩(wěn)妥的方式,還是進(jìn)一步達(dá)成產(chǎn)品和服務(wù)的全棧。在達(dá)成技術(shù)全?;A(chǔ)上,產(chǎn)品的全棧要考慮交互、能否量產(chǎn)等問題。而服務(wù)的全棧之所以重要,原因在于它可以把技術(shù)元素、硬件和生產(chǎn)等元素結(jié)合起來,這中間有很多需要協(xié)助客戶完成的工作。

    3

    優(yōu)化產(chǎn)品體驗需運用工具和SOP提升測試規(guī)范 

    第三個問題是難以把控的產(chǎn)品體驗。

    和考試不一樣,在 AIoT領(lǐng)域,即使產(chǎn)品的每個零部件都是高分性能,它的最終表現(xiàn)有可能是非常低分,這里牽涉屬性沖突的問題。

    “真正的好產(chǎn)品不是紙面設(shè)計的高大上,而是極佳體驗。各部分零部件的性能磨合非常重要。”康恒表示說。

    而性能磨合需要的是不斷的試驗和測試,目前在產(chǎn)業(yè)界,這點做的并不好。不少欠成熟的企業(yè)還是粗放式驗收,“把生產(chǎn)出的音箱擺在測試工位上,然后讓測試員不斷重復(fù)歡迎詞和查天氣,類似的驗收方式都是很不正規(guī)的。”

    對于如何為客戶提升測試的標(biāo)準(zhǔn)化從而提升產(chǎn)品體驗,云知聲提供了一系列工具,以及SOP,可以把控客戶在測試環(huán)節(jié)的規(guī)范運作。

    “比如說,麥克風(fēng)是否有不良,一致性是不是夠好,裝配之后,結(jié)構(gòu)是否有密封或者振動問題?我們有一系列的工具來幫助大家,無論是IQC或者最后的產(chǎn)測,甚至有一些是自動化的工具。”康恒說。

    產(chǎn)品本身性能和團隊協(xié)作決定了產(chǎn)品周期

    產(chǎn)品周期對于廠商來說也是一個極大的考驗。

    其中,最常見的問題是盲目樂觀,不少廠商自認(rèn)為做硬件經(jīng)驗很豐富,做音箱、或智能家居就可以得心應(yīng)手。

    但這個邏輯,在康恒看來是不成立的。

    在他看來,實際與產(chǎn)品周期緊密相關(guān)的,不是做硬件是否有經(jīng)驗,或者說企業(yè)的規(guī)模、實力、人數(shù),這些都是邊緣因素。真正起決定性的,一是上述產(chǎn)品本身的性能體驗可以在多長時間內(nèi)做到極致,二是團隊協(xié)作,在新品的架構(gòu)上,AI、硬件、軟件和云端服務(wù)都需要不斷磨合。

    在如何縮短產(chǎn)品周期的問題上,康恒表示云知聲會根據(jù)具體服務(wù)公司的業(yè)務(wù)提供方案。

    4

    開源代碼設(shè)計促進(jìn)產(chǎn)品實現(xiàn)快速復(fù)制

    最后一點,是如何能夠在不同的產(chǎn)品之間實現(xiàn)快速復(fù)制。

    產(chǎn)品形態(tài)的碎片化,導(dǎo)致了方案商在獲得收益方面不能靠單一的產(chǎn)品形態(tài)或者方案獲得滿足,需要考慮不同的應(yīng)用場景。那么,一個產(chǎn)品的開發(fā)能否用到之前積累的代碼和設(shè)計,能否將成功經(jīng)驗復(fù)制到新的產(chǎn)品項目中,對方案公司來說至關(guān)重要。

    “有時候,這點甚至事關(guān)方案公司的生死。”康恒強調(diào)說,如果產(chǎn)品之間可以實現(xiàn)快速復(fù)制,投入將可以極大減少。

    在如何優(yōu)化提升產(chǎn)品復(fù)制的問題上,云知聲采用了代碼開源和根據(jù)客戶需求完成定制兩種方式。據(jù)康恒介紹說,云知聲目前都是開源代碼設(shè)計,方案商可以根據(jù)需求修改代碼,在云端服務(wù)層,會根據(jù)客戶的需求,或者具體產(chǎn)品的需求來完成定制的工作。

    結(jié)語

    無論是“百箱大戰(zhàn)”還是“百家爭鳴”,在AIoT大火的背后,終端碎片化、供應(yīng)鏈分散、產(chǎn)品體驗難提升、產(chǎn)品周期難把控、產(chǎn)品經(jīng)驗難復(fù)制,這五大暗流成為影響產(chǎn)業(yè)良性發(fā)展的重要風(fēng)險因子,定制芯片,技術(shù)、產(chǎn)品、服務(wù)全棧,運用工具和SOP,優(yōu)化團隊協(xié)作,開源代碼設(shè)計是云知聲給到行業(yè)的五大對策。

    雨燕 AIoT 芯片的開源方案現(xiàn)場展示

    對于云知聲來說,“雨燕”在智能音箱和智能家居中的應(yīng)用讓其邁出了馳騁在AIoT領(lǐng)域的第一步,其后的“雪豹”和“旗魚”還將致力于智能汽車和智慧城市。在產(chǎn)業(yè)界,優(yōu)秀的公司會擔(dān)綱領(lǐng)導(dǎo)者的角色,它們未來會有怎樣的建樹,“機器人文明”將與您一起持續(xù)關(guān)注!


  • ·上一篇:
    ·下一篇:
  • 其他關(guān)聯(lián)資訊
    深圳市日月辰科技有限公司
    地址:深圳市寶安區(qū)松崗鎮(zhèn)潭頭第二工業(yè)城A區(qū)27棟3樓
    電話:0755-2955 6626
    傳真:0755-2978 1585
    手機:131 1300 0010
    郵箱:hu@szryc.com

    深圳市日月辰科技有限公司 版權(quán)所有:Copyright?2010-2023 xbquwah.cn 電話:13113000010 粵ICP備2021111333號