內容字號:默認大號超大號

段落設置:取消段首縮進段首縮進

字體設置:切換到微軟雅黑切換到宋體

業界資訊軟件之家
Win10之家WP之家
iPhone之家iPad之家
安卓之家數碼之家
評測中心智能設備
精準搜索請嘗試:精確搜索

Siri未來能讀心?看看AI語音助手的五大進階趨勢

2019-10-9 11:15:48來源:網易科技作者:樂邦責編:孤城評論:

自2011年Siri首次出現在iPhone 4S上以來,語音助手已經從一種華而不實的噱頭變成了智能音箱技術的根基。未來的AI語音助手還會進化成什么樣的高度呢?

如今,智能音箱已經滲透到了美國六分之一的家庭。

尖端人工智能語音技術開發商Nuance Communications的創新主管湯姆?赫伯納(Tom Hebner)向Digital Trends表示:“在Siri出現之前,當我談論(我所做的)事情時,人們的眼神都是茫然困惑的。人們會說,‘是你們開發了那些可怕的手機系統嗎?我恨你們。’當時人們對于語音技術都是這樣的反應。”

但今天情況已經截然不同了。據市場研究機構eMarketer預測,到2020年,將有近1億智能手機用戶使用語音助手。盡管人工智能助手不再是新鮮事物,但我們仍處于該類技術的進化初期。要完全兌現語音助手作為一個產品類別的潛力,仍然長路漫漫。

目前,可以從以下五個方面來讓AI助手變得更智能、更高效,從而幫助我們過上富有成效的生活。姑且把它們稱為“預測”或“愿望清單”,畢竟它們都是些需要解決的挑戰。

1)充實專業知識庫

亞馬遜的AI語音助手Alexa可以告訴你各種各樣的東西,比如:馬來西亞吉隆坡的天氣狀況;總共720南非蘭特可以兌換720美元;生僻復雜的單詞如何拼寫。但從本質上講,消費級人工智能助手就相當于數字世界中一個擁有一整套最新百科全書的人。你從它們那里得到了正確的信息,但它們并不具備專業級別的專項知識。

赫伯納在接受Digital Trends采訪時表示:“你家里的智能設備所面臨的挑戰是,它們嘗試給你解決的事情太過寬泛了。”

這是一個很難解決的問題,但一旦解決了,就能產生顛覆性的影響。Nuance開發了許多針對特定用例的專家級系統,比如幫助航空公司客服回答客戶的問題,或者幫助醫生做筆記。這樣做不僅意味著這些系統可以深度獲取更詳盡的信息,還意味著它們可以產生更多的智能。“人們對能夠理解單詞意思的計算機感到非常興奮,但如果計算機不知道該如何作出回應,那就不一定有意義了。”赫伯納說道。

他列舉了一個例子:一個Nuance系統不僅能理解醫生跟病人說的潛在藥物清單,還能指出那些藥物之間潛在的沖突。這遠遠超出了大多數消費級人工智能助手的能力。

然而,AI助手在不同領域擁有更專業、更詳盡的知識——Alexa技能暗示了這一點——可能是革命性的。從表面上看,向你的智能助手尋求法律或醫療方面的專業建議聽起來很瘋狂。但業界在法律機器人等領域已經取得了非凡的進步,最近發布的一份報告也顯示,蘋果希望到2021年Siri能夠與用戶進行以健康為主題的對話。

人工智能助手的專業知識圖譜可謂兌現了科幻小說的情節,最近發布的Voicebot.ai報告也顯示,虛擬助手的技能集正在迅速擴大。隨著它們進入各個專業領域,我們將會受益不淺!

2)更強的個性化功能

今天智能音箱的個性化還處于起步階段。你可以改變語音助手的口音和性別表現,為其添加或刪除技能,給它輸入一些信息,比如你的名字和工作地點。在某些情況下,你可以設置多個語音配置文件,以便谷歌的Google Home能夠識別你家中的各個成員。

▲亞馬遜Echo Show智能音箱

但智能助手在個性化上還有很大的提升空間——不過往這方面努力還是很值得的。Mattersight公司開發了一種名為“預測行為路由選擇”(Predictive Behavioral Routing)的人工智能呼叫中心技術,該技術可以分析呼叫者的言語模式,并將其與性格相容的人類接線員進行匹配。根據該公司的說法,給呼叫者匹配性格相容的人類接線員有助于溝通順暢,相比匹配性格相沖突的接線員,通話的時間也能縮減一半。

使用類似的方法,可能會使得人工智能助手會用你喜歡的方式與你交談。比如提供像匹配談話對象的口音和音量這樣的簡單的功能。或者,智能助手也可以改變其表達方式,對某些用戶使用更有感情色彩的詞匯來表達感想,而不是像面對其他用戶那樣更多地使用細節性的信息。也許有的人想要與語音助手進行長時間的交談,有的人則只是想要語音助手能以最簡潔的方式傳達必要的信息。人工智能助手應該同時具備這兩種能力。

像谷歌Duplex這樣的技術顯示出,人工智能生成的合成語音和對話正在變得多么地準確。隨著人工智能涉足比回應歌曲播放請求和設定食物定時器更復雜的任務,預計這項技術將會在我們的日常生活中扮演更加重要的角色。

這有望借助語音識別技術的突破得到實現。赫伯納指出,Nuance的技術僅憑一秒鐘的音頻便能識別用戶身份。“過去,語音識別技術需要10秒鐘的時間才能了解你是誰,才能得到準確的信號。”他說,“如今,這種技術威力非常強大。”這種技術能夠通過一小段語音識別用戶意味著它能解決密碼問題,也意味著你可以選擇使用語音助手來獲取相對微妙的機密信息。

3)由被動變主動

優秀的助手會在你提出要求的時候給你做事,而卓越的助手則不需要你提出要求,而是能夠前瞻性地主動幫你解決問題。目前,人工智能助手還處于第一個階段。用戶可以得到他們想要的歌曲,可以得到他們所需要的提醒,但通常只有在他們向語音助手明確提出要求以后才能得到。隨著人們越來越習慣于使用語音助手,它們有很大的機會從單純的被動型設備轉變為主動型設備。

你覺得人工智能助手代表你做決定怎么樣?這些建議可以是:當有人說他們覺得冷的時候,把恒溫器打開;或者因為你遲到了,重新預約了一次午餐會議;督促你更多地進行運動鍛煉,或者節省開支。隨著越來越多的智能設備進入家庭,語音助手可以控制的東西將會大大增加。

這在一定程度上是一個社會問題,即人們對讓機器做決策有多放心。人們是否愿意把某些任務交給機器呢?這還存在很大的疑問。不妨將此想象成把你的信用卡和房子鑰匙交給你的人類助手。不好的地方在于,你得放棄一定程度的控制權。潛在的好處是你會有更多的空閑時間。當然,這是一個巨大的技術挑戰……

4)反饋機制

赫伯納指出了賦予語音助手主動性的一大挑戰:我們的機器如何知道自己做對還是做錯?說回“優秀的助手”和“卓越的助手”的概念上,卓越的助手會在一個大型會議之前把你所有的文件都拿出來,而不需要你提出要求。但是,如果文件拿的不對呢?讓家庭人工智能助手變得更主動的一個大問題在于,目前只有有限的方法來揭示我們獲得的信息是不是我們所需要的信息。

▲Pepper人型機器人

“如果我每天走進家門都要聽同一首歌,然后有一天我走進家門,智能助手就開始播放,它怎么知道自己選對歌了呢?”赫伯納說,“如果我不停止播放,那是否意味著它選對了呢?如果我跟它說“停止播放”,那又是不是意味著它選錯了,不應該再播放那首歌了?反饋機制缺失,是你沒有得到更積極主動的智能系統的原因之一。”

對于工程師來說,這是一個具有挑戰性的問題。任何有過被實習生就每一項任務征求指導和反饋意見的經歷的人都知道,有時候自己親自做一項工作比委派別人去做來得更容易。人工智能助手要能夠讓你的生活工作變得更順暢;而不是每天讓你做幾十個小調查來確認它的工作有沒有做對。這將需要以一種不會損害這些設備的用戶友好性的方式來解決,并且在系統了解你的偏好之前不需要進行大量的預先培訓。

5)新的交互方式

科幻電影《2001太空漫游》(2001:a Space Odyssey)有這么一個場景:兇殘的HAL 9000——令人不安的是,它仍然是歷史上最著名的虛構人工智能助手——揭示出,它不只是利用麥克風來判斷別人對它說了什么。當兩名機組人員試圖選擇一個他們知道HAL 9000聽不見的地方說話時,HAL 9000透露,透過閱讀兩人的嘴唇運動,它仍然能夠知道他們說了些什么。

很可怕吧?未來人工智能助手或許也能這么干。

語音助手應該局限于語音互動的想法,減少了它們與我們有效互動的潛在方式。隨著面部識別和情緒跟蹤技術日益興起,人們越來越多的生物特征識別數據被不斷收集,讀心技術甚至也有可能出現,人工智能助手可以使用大量不同的信號來得出結論。

10年后,我們將只能使用語音來控制這些人工智能助手的想法,就像在上世紀80年代初看到個人電腦時,會想,我們永遠不會再有別的帶有鍵盤的計算設備。

相關文章

關鍵詞:siri語音助手

IT之家,軟媒旗下科技門戶網站 - 愛科技,愛這里。

Copyright (C)RuanMei.com, All Rights Reserved.

軟媒公司版權所有

4449999开奖结果