iVoka語音交互技術簡介 iVoka是已經(jīng)搭載在上汽榮威車型上inkaNet系統(tǒng)的3.0版本,相比上一代系統(tǒng),它的亮點是加入了智能語音交互系統(tǒng),即通過語音命令來代替?zhèn)鹘y(tǒng)按鍵的輸入方式。不過這種語音交互方式也對系統(tǒng)提出了更高的要求,如果想取得更好的用戶體驗,系統(tǒng)就需要準確的識別人類語言所要表達的意思,同時做出合理且人性化的反饋,而且系統(tǒng)的思考時間也不可過長等等。當然要實現(xiàn)這些并不容易,我們可以把這些目標看作一個標桿,越接近它,就說明這套系統(tǒng)的人機智能化越發(fā)達和人性化。 目前iVoka系統(tǒng)可以對打電話、發(fā)短信、導航、資訊查詢、聽音樂、聽廣播實現(xiàn)語音控制,其它功能暫時仍需要手動輸入指令,下面我們就來看看iVoka語音控制功能的表現(xiàn)究竟如何。 簡單來說,我們可以把裝載在車輛上的這套iVoka系統(tǒng)看成是一部安裝有安卓系統(tǒng)的智能手機,通過觸摸式屏幕我們可以對其進行隨心所欲的控制。其中的人機交互系統(tǒng),更像是你的一個貼心助手,對你的命令或者需求作出相對人性化甚至是幽默式的回應,而且用戶無需拘泥于死板的語法結構,只需用簡單或者日常用語向機器表達自己的訴求。 ● 接/打電話 要實現(xiàn)這個功能首先需要通過藍牙將手機中的聯(lián)系人信息傳送到iVoka車載系統(tǒng)中,通過語音命令iVoka來撥打電話。當有電話打進來時,系統(tǒng)也會通過語音來詢問用戶是否接聽此電話。 ● 接收/發(fā)送短信 通過語音來發(fā)送和獲取短信內(nèi)容,可以使駕駛員的注意力更多的集中在車輛駕駛上。但是在語音輸入短信內(nèi)容時,用戶必須使用標準的普通話(當然也不至于到新聞聯(lián)播的水平),否則系統(tǒng)會產(chǎn)生錯誤識別的情況發(fā)生,同時由于中文多音字的原因,也會偶爾使系統(tǒng)對用戶的語音命令產(chǎn)生誤解。 ● 導航 進入導航功能后,在搜索具體目的地時有兩種途徑,一是通過語音與iVoka車載系統(tǒng)進行人機交互;另一種則可以遠程呼叫客服人員,通過人與人的溝通,將目的地信息下載到導航地圖中來實現(xiàn)車輛導航。 ● 資訊查詢 通過語音交互系統(tǒng)可以實現(xiàn)的資訊查詢包括了當前時間、日期、某城市的天氣情況以及航班信息,應該說內(nèi)容相對有限。不過隨著功能的逐漸豐富,未來還會加入如股票、新聞等更多的可以通過人機交互系統(tǒng)來完成的資訊查詢和獲取。 ● 聽音樂、廣播 收聽音樂分為兩種情況,一是讀取本機,即SD卡上的音樂文件,并且可以通過語音命令直接說出想要聽的歌曲名稱,此時iVoka系統(tǒng)便會播放此音樂。另一種是通過系統(tǒng)的3G網(wǎng)絡在線收聽網(wǎng)絡音樂,只是還不支持網(wǎng)絡音樂搜索功能。 收聽廣播時,用戶只需說出電臺的頻率,系統(tǒng)便可直接轉(zhuǎn)入相應的電臺,同時可以將喜愛的電臺通過語音命令進行收藏。今后用戶還可以發(fā)出“收聽北京音樂臺、北京交通臺”的類似指令,讓系統(tǒng)直接跳轉(zhuǎn)至對應電臺,無需用戶記下電臺的頻率。 ● 像操作智能手機一樣來實現(xiàn)其它功能 這套iVoka車載智能系統(tǒng)采用開放式的安卓系統(tǒng),通過安裝各種第三方軟件可以豐富它的功能,再加上觸控式的屏幕,對于年輕人來說,上手很容易,且就像操作智能手機一樣輕松自如。 ● 日后與CAN總線的融合為用戶提供更多行車數(shù)據(jù) ● 目前它還像一個兩三歲的孩子 日后通過“教育”會讓它變得更加聰明和智能化 這套系統(tǒng)目前仍處于測試階段,所以還存在諸多不完善的地方,而主要問題集中在以下幾點: ① 雖然iVoka系統(tǒng)已經(jīng)可以識別一個意思的多種表達方式,使用戶不必糾結于嚴謹?shù)恼Z法結構,但是由于中文的博大精深,難免會出現(xiàn)無法識別的語言表述情況。 ② 目前iVoka系統(tǒng)只支持普通話,而且每一個語音指令都需要用戶字正腔圓的朗讀清楚,否則系統(tǒng)就會出現(xiàn)識別錯誤或者無法識別的情況。 ③ 系統(tǒng)的反應速度受制于硬件的原因還不夠令人滿意,用戶發(fā)出的每條指令,系統(tǒng)都需要至少2秒鐘的時間才可以做出反應。 ④ 在人機交互系統(tǒng)方面還不夠人性化,由于iVoka的語音回復詞庫是預先植入到系統(tǒng)內(nèi)的,而詞庫的豐富程度也就決定了它是否可以像人類交談那樣賦有多種情感。 ⑤ 這套iVoka系統(tǒng)通過語音交互來實現(xiàn)的功能還比較有限,像接、打電話等常用到的功能外,其它諸多功能仍需通過傳統(tǒng)的手寫方式來實現(xiàn)。 目前iVoka的理解力、表達能力以及智商還像一個兩三歲的孩子,成人之間的話語可能并不能被它所理解,自然也無法做出合理的回應,更談不上深入或者帶有情感的交流。不過通過不斷對它進行語言上的“教育”以及邏輯思維能力的“培養(yǎng)”,相信它會越來越接近人類的智商,使人與機器間實現(xiàn)更輕松的互動。 ● 使用費用 該系統(tǒng)采用聯(lián)通3G套餐業(yè)務,頭兩年免費,其中每月有100分鐘通話時間和400兆流量。根據(jù)目前所反饋的情況,這樣的資費內(nèi)容可以滿足絕大部分用戶的使用需求。 |