TechRoomage

蘋果真正的想法:Siri如何由機器成為人

0 1

原標題:蘋果真正的想法:Siri如何由機器成為人

更真實的 Siri

蘋果真正的想法:Siri如何由機器成為人

很快 iOS 11 的正式版就將來到每一位 iOS 使用者的手中,新系統帶來了大量的新變化,足夠人們試玩上很久。即使你已經很長一段時間沒碰 Siri 了,到時候也推薦再去試一試。如果你還記得它原來的聲音,那麼就可能會發現現在的不同。

很難精確地描述 iOS 11 的 Siri 和過去相比多了哪些東西,你可能就是感覺它聽起來好像更加真實了。在說話的時候,Siri 會在句子間加入更多的停頓,更多的長音,更輕快的語調變化。總的來說,它將會比過去更流暢,更像「人」。蘋果認為,這樣的 Siri 你會更喜歡聽它說話,也就更願意和它說話。

事實上,蘋果對 Siri 語音真實度的執著可能會超出你的想象,因為它在 Siri 語音組主管阿萊克斯·阿賽洛(Alex Acero)的主導下,已經進行了長達數年的研究和優化了。直到 iOS 11 到來,他才終於拿出了滿意的成品。「它很自然!一點都不像機器人!」阿賽洛興奮地評價新 Siri 說。

當然了,現在距離蘋果理想中的「愛上你的虛擬助手」還遠得很,但阿賽洛和他的團隊認為現在已經前進一大步了。這些研究者堅信,只要 Siri 說話能夠更自然流暢,那人們也就會更加信任它,最終接受它。開始成長

蘋果真正的想法:Siri如何由機器成為人

儘管現在 Siri 表現出了相當的潛力,但誰都不會忘記它在過去的幾年裡存在感有多低。很多人覺得它已經遠遠落後於競爭對手。相比之下,亞馬遜的 Alexa 有更多開發者支持,而谷歌的 Assistant 則「知識面」廣得多。

對此蘋果倒也是滿腹委屈的,它表示 Siri 過去的控制權不完全在自己手上,後端技術是由其他合作夥伴提供的。蘋果的產品營銷高級副總裁格雷格·喬思維亞克則很露骨地說:「這就好像是在賽跑的時候,你知道嗎,有人在拖我們的後腿。」

這個「拖後腿的人」到底是誰,所有的證據都指向 Nuance 公司,雖說雙方從來都沒承認過存在合作關係。但不管背鍋的人是誰,總之蘋果對 Siri 確實有「很大的計劃」,而且對它的控制力也比以前更強了,這是喬思維亞克承認的。

接手 Siri 並全權控制它的就是阿萊克斯·阿賽洛帶領的團隊,這使得它不再依賴過去的演算法,而是接納了更先進的 AI 技術和深度學習理念。Siri 要做到的不再僅僅是識別準確(蘋果官方的數據稱其語音識別準確度可以達到 95%),它還需要能夠在各種聲音中無誤地識別出使用者的聲音來,這也才能夠在個性化這方面更進一步。

在這方面 Siri 憑藉新的機器學習機制就可以逐漸做到這一點,它獲取的數據越多,其建立的模型就會變得更好,更智能,甚至可以識別很重的口音。這一點非常重要,因為有研究者最近發現 Siri 是能夠聽到人耳聽不見的超高頻聲音的,這就造成了潛在的安全威脅。蘋果重視隱私,那就必須要在「區分」上下功夫。學會說話

蘋果真正的想法:Siri如何由機器成為人

Siri 學會一門新語言的過程很有意思。團隊首先會在當地尋找堪稱標準的人,然後讓他讀書、讀報紙、讀網頁,還有各種各樣的東西。然後蘋果將這些聲音和文字一一對齊,更重要的是識別每一個音。Siri 對這些音素的判斷,是最有趣的地方。

在那些已經錄製好的音頻中,Siri 團隊試圖找到每一個音所有的說法,比如連讀、輕讀、重音、長音、升調、降調等等。我們都知道,同一個音表達肯定和表達疑問的時候都可能會有不一樣的變化,而這些變化都會有不同的聲紋,要讓蘋果的演算法分析之後放進它認為最合適的地方。如果我們把每個音看作一個個點,那麼句子就是連成的線。你可能過去會認為 Siri 讀的每一句都是預先錄好的內容,其實並非如此。

不同意思的不同句子中相同的詞語,如果要表達的東西差別很大,那麼這詞語中的一切音素都很可能不是來自同一段錄音的。

值得一提的是,Siri 在這方面表現得之所以一直不太理想,處理性能也是一個很重要的因素。幾年前的機能水平不足以讓系統以很高的頻率在一個龐大的資料庫中尋找最完美的組合。如今這已經不是問題了,所以阿賽洛開始希望自己能擁有的數據量越龐大越好。所以蘋果在 iOS 中推出了聽寫功能,讓人們能夠將自己的錄製片段上傳上去,從而大幅增加數據量。在這樣的反覆優化和升級中,Siri 對語言的掌握就逐漸被建立起來了。Siri 完全體

蘋果真正的想法:Siri如何由機器成為人

蘋果眼中最理想的「Siri 生活」是什麼樣的呢?當然是它要儘可能包攬一個人日常生活里的方方面面了。在一則廣告里,主角巨石強森用 Siri 檢查了提醒事項,叫來了車,查看了天氣,以及各種各樣的事情。

有一點非常值得注意,那就是像喬思維亞克這樣的人其實很不喜歡人們去「調戲」 Siri。「我們做這個東西不是用來玩問答遊戲的!」他說。儘管不少人現在覺得這才是 Siri 的樂趣所在,但蘋果一直很注意不將它打造成一個真正的聊天機器人,而是專註在自動化上。

你不能用 Siri 來做任何事,而蘋果也不打算這麼做。蘋果在設備的功能實現上一向十分功利,這在 Siri 的定位上也有體現。它能夠幫助你完成各種操作和服務,除此之外的就不擅長了。蘋果不以為意,因為它就是要這個。

當 Siri 變得更好用之後,怎樣才能讓早就不抱期望了的使用者重新關注起它來呢?蘋果的意思是讓時間來解決問題。「人人都有自己做事的習慣。如果他們習慣了打字,一下子去改變,那得要時間。」阿賽洛說。當然不只是等,它還會試圖引導人們到「正確」的方向上來。很可能,Siri 將會變得更加主動。

至於很多人都要求的讓 Siri 更開放的問題,因為開發者能讓 Siri 的功能迅速激增。然而儘管蘋果在其他領域是這麼做的,但在 Siri 這邊卻並非如此。喬思維亞克認為,關鍵不在 Siri 能做多少事。它認為無論是 Alexa 還是 Assistant,要給它們下指令,用的語句都太模板化了。開放給第三方之後,這個問題會更加嚴重。

那麼解決之道在何處呢?最終蘋果心中的答案還是落在了「更像人類」上。當 Siri 的聲音變得更加真實可信時,一切問題都會迎刃而解。

Leave A Reply

Your email address will not be published.