曾繁日-竞彩足球玩法规则大全-c罗欧洲杯夺冠-棒球比赛视频|www.sdydsy.com

邏蘭
博世
雅馬哈
當前位置:中國數字視聽網首頁 > 專業音響 > 觀察 > 正文
快速搜索:

智能音箱會讓阿里再次“芝麻開門”嗎?

2017年07月07日 13:38  來源:中國數字視聽網  字體【   

【中國數字視聽網訊】2017年7月5日,阿里人工智能實驗室在北京時間博物館發布了一款名為“天貓精靈”的智能語音音箱。一個智能語音音箱,對于阿里的意義來說卻可大可小。

2003年5月淘寶成立,當年10月推出支付寶。此后迄今14年,淘寶一路超越ebay易趣、雅虎等成為亞洲第一大網絡零售商。2008年推出淘寶商場,2012年1月更名為天貓,2017年7月“天貓精靈”公測。


阿里公眾與客戶溝通部張啟表示,“感覺現在的天貓精靈有點像2003年淘寶剛開始發展的時候,一切都剛開始。”從當年淘寶第一版非常丑陋的網頁入口到今天精工細作的智能語音音箱入口,“天貓精靈”會不會成為阿里的下一個進化奇點?人工智能時代,阿里的進化之路又將如何演進?

阿里的“航天飛船”

2016年,阿里人工智能實驗室(A.I.Labs)成立,負責阿里巴巴集團旗下消費級AI產品的研發。2017年3月,阿里宣布“NASA計劃”,聚集于核心領域的研究,解決未來10年到20年后的困難。而“天貓精靈”作為阿里自研的硬件產品,實際上承擔了類似“航天飛船”的硬件功能。

阿里人工智能實驗室負責人陳麗娟(花名:淺雪)在“天貓精靈”發布會上介紹,天貓精靈X1比亞馬遜Echo和蘋果的Homepod都小巧,這樣的設計是為了進入家庭時沒有侵入感。當然,“天貓精靈”的小巧外形很有可能是針對中國家庭的面積而設計。

為了實現小巧的外形設計,天貓精靈X1采用了首顆專門為智能語音行業開發的芯片,針對需要進行大量音頻處理、聲音合成的工作環境,定制芯片加入了獨立的NEON處理單元,可加速音頻和語音處理、電話和聲音合成等,帶來更優秀的語音識別及音頻處理效果。

天貓精靈X1內置中文人機交流系統AliGenie,AliGenie實際上與阿里人工智能大腦ET共享技術成果。依靠阿里云強大的機器學習技術和計算能力,AliGenie作為人工智能系統就已經很成熟。因此,天貓精靈X1的難點并不在語音識別、智能語音交互等人工智能功能,反而在于硬件的設計、制造、供應鏈管理等阿里之前沒有涉及到的業務領域。

陳麗娟表示,阿里之所以沒有選擇外包的方式來完成天貓精靈X1的硬件設計、生產和制造等工作,是因為智能語音音箱涉及到了非常復雜的軟硬件集成與硬件工程,目前在市場上還找不到一家能夠滿足所有上下游零部件集成研發、生產與制造的廠商,因此阿里只好自己來承擔這個硬件產業集成的角色。

全面激活阿里技術生態體系

天貓精靈X1和AliGenie應用了阿里積累多年的語音識別、自然語言處理、人機交互等技術。

基于聲紋識別技術,X1還推出了聲紋購功能,這也是是第一個商用的聲紋購物系統。

阿里人工智能實驗室的語義理解系統還帶有記憶功能和總結歸納能力,加入了模擬的“長期記憶”和“短期記憶”功能,能夠針對不同的場景和時間度,讓語義理解系統更加貼近用戶。除此之外,阿里人工智能實驗室還已經著手其他多個語種的研究。

現在,這些阿里技術生態體系,也隨著AliGenie開發者平臺對外開放,包括了語音技術、服務入口以及硬件方案,并整合阿里生態體系中豐富的互聯網服務和商業鏈接能力,共同為消費者提供智能體驗。

AliGenie開發者平臺主要面向四種類型的開發者:內容開發者、應用開發者、智能家居開發商和硬件生產商,開放的核心技術包括深度學習、自然語言處理、搜索/推薦算法、知識表示及推理問答系統等,將免費開放給開發者和硬件廠商,無需從頭搭建AI語音系統。

至于為什么叫X1,阿里表示在數學中“X”代表未知數和變量,天貓精靈X1作為阿里消費級AI產品的開端,也充滿著未知和變量,阿里人工智能實驗室推出的第一款產品因此命名為X1。

語音交互是思維方式的變革

自從亞馬遜推出Echo智能語音音箱以來,全世界都把目光投向了下一代人機交互方式:智能語音。今年恰逢iPhone十周年,10年前iPhone用手寫人機交互方式徹底顛覆了之前的鍵盤式人機交互,當年很多IT和手機企業都死守鍵盤交互而最終被甩出歷史的舞臺。

iPhone的手寫人機交互是蘋果公司的首創么?當然不是,之前已經有包括微軟在內的多家科技公司研發出了手寫觸屏人機交互技術,但在PC鍵盤思維統治之下,沒有一家公司愿意相信一個沒有鍵盤的手機會成功。蘋果推出第一代iPhone,不僅僅是一個技術和產品路線的選擇,而是思維方式和觀念的徹底變革。

沒有鍵盤的手機,到底如何成功?十年后的今天,同樣的問題又出現了。沒有手寫觸屏的智能終端,到底如何成功?如果僅僅把智能語音人機交互看成是一種技術和產品路線,顯然無法成功。就像當年的iPhone一樣,智能語音人機交互本質上是一種思維方式的變革。

怎么理解智能語音人機交互是一種思維方式的變革呢?

很簡單,如果一個智能終端只剩下一個麥克風和音箱來完成人機交互的話,就將失去手寫和鍵盤輸入的豐富而明確的選項與空間,只剩上下句對話之間的極為有限的選項和空間,這種極簡、有限而又模糊的方式,勢必倒逼整個互聯網產品與生態的重新思考與再設計。

一款智能語音音箱,僅僅是這個重新思維與再設計過程的起點。只有通過學習和積累實際使用智能語音音箱產品的用戶行為大數據,才有可能完成這個重新思維與再設計。經過這個過程的洗禮,下一個阿里的形態,才有可能浮出水面。

(編輯:daisy)

中國數字視聽網微信公眾平臺:
搜索“數字視聽網”或掃描下面的二維碼,關注官方微信平臺,開啟視聽行業新聞資訊新旅程!
[雅馬哈]MCR840
[雅馬哈]MCR840
價格:2200元
[惠威]KX1000
[惠威]KX1000
價格:4000元
[Bose]DS100SE揚聲器
[Bose]DS100SE揚聲器
價格:面議
[瑞豐]TC15
[瑞豐]TC15
價格:面議
明基
MAXHUB
快捷
產品關注排行
"掃一掃"關注我