原標題:小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

我們和阿里巴巴的天貓精靈、小米的小愛同學一起生活了幾天。

「小愛同學,放一首雷軍的歌。」

「好的,為你播放雷軍精選歌曲。」

幾秒的停頓之後,一個異常響亮的聲音響起,「33333Q! Are You OK?!」

桌面上迷你版空氣凈化器一般長相的小米 AI 音箱放起以雷軍印度演講素材剪輯而成的鬼畜音樂《Are you Ok》。

第一次接觸智能音箱,你很難忍住不去問它一些奇奇怪怪的問題,看看它有多聰明或者多愚蠢。

它居然有一個雷軍的歌單,下一步你就會問它:「小愛同學,你的老闆是誰?」

這時候它又聽不懂了。

就好像 2011 年,Siri 剛出現在 iPhone 上時一樣,儘管它常常回答你「我好像不明白」,那些預設好的、你意想不到的抖機靈也會讓人感到驚喜:原來它還懂這個。

今天沒有多少人養成用 Siri 的習慣。新鮮感過去,「不明白」帶來的挫敗感就會打消你的熱情,它終究是個沒什麼用的東西。

早幾年綁著手機的語音助手都失敗了,技術公司們轉向了可以獨立運作的智能音箱。這個由亞馬遜 Echo 兩年前啟動的趨勢最近蔓延到了中國。8 月,小米 AI 音箱開始公測。更早一個月,阿里巴巴的智能音箱,天貓精靈 X1 也開始公測。若琪、出門問問等多家創業公司的產品也已推出。

關於音箱的故事也都差不多。從直接播放網際網路服務的音樂,到一句話操控小米米家的智能家電,或者去淘寶下單購物。它是一個入口。

但故事歸故事,沒用的話還是會被人忘掉,就像 iPhone 內置的 Siri。

所以這些音箱有用么?過去幾周,我們和小米和阿里的音箱進行了上百小時的對話。

「小愛同學,你覺得你長得漂亮嗎?」

「額,還好吧,我覺得我長得不醜啊。」

考慮到收音和播放效果,音箱是一個你會放在客廳中心區域的東西,所以,一個音箱長得好不好看,外觀設計如何,還是挺重要的。

正在公測期間的小米 AI 音箱一看就是小米的產品:白色、造型簡單、塑料材質外殼。作為音箱,它拿在手裡並不重,機身底部四周打上了很多不規則設計的出音孔,四方形的造型除了頂部轉角的弧度略有不同,整體就像是一個迷你小米空氣凈化器。

小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

首次接上電源之後,音箱頂部邊緣的一圈 LED 燈帶會開始閃爍柔和的藍光。在接下來的使用中,這一圈燈帶的顏色也是互動反饋之一。幾秒鐘后燈帶會變成橙色,進入配對模式。

這款音箱還未正式上市,小米在音箱上貼了一張二維碼,掃了就能下載還在測試中的小米 AI 應用,將手機和音箱配對。

下載完成後的配對很自然,手機會自動通過藍牙找到音箱,然後提示你輸入家裡的 Wi-Fi 密碼,輸完音箱就會自動連上 Wi-Fi。這比亞馬遜 Echo 需要先用手機連接音箱生成的 Wi-Fi 熱點方便許多。

不過方便也是因為它目前僅支持 Android 手機,應用可以直接控制藍牙。如果放在對應用限制較多的 iPhone 上,流程會有變化。

音箱的頂部控制區過於像 iPod 的控制盤。上面放置了控制音量、快進歌曲、靜音麥克風還有進入配對模式的四個觸摸按鍵,但按下后並沒有任何震動或者聲音上的反饋,很容易讓你懷疑自己有沒有正確操作。

按鍵周圍還有一圈觸摸條,可以滑動調節音量。由於 LED 燈帶里的燈泡太少,你的手指要劃出一段才能看到音量變化。

總之需要觸碰的操作,在小米 AI 音箱上都體驗不佳。但習慣了用聲音和它對話之後,你基本上不太會用到這些按鍵。

小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

「小愛同學」既是小米 AI 智能音箱的昵稱,也是它的喚醒詞。喚醒后它的燈帶會亮起來,並指向你發聲的方向。如果網路有一定延後,至少燈帶的亮起可以給你已經獲得反饋的感覺。

每一次你需要和它對話,你都要用喚醒詞「小愛同學」開始,而它每一次都會回應:「欸,我在!」

你也要等它說完這一句之後,才能發出下一步的指令。

「小愛同學,播放一首不同的歌。」

「好的,正在為你播放《不同》。」

音箱最重要的當然是放音樂。

以往藍牙音箱也可以放 QQ 音樂或者蝦米、網易雲音樂等服務里的歌曲。但你得在手機上選歌。

目前的智能音箱,如果你下班回到家,癱在沙發上,想要給家裡來點聲音,或是在聚會上需要來點背景音樂調節氣氛,對著家裡的智能音箱說幾句話,就能滿足這些需求。

面對智能音箱,就簡單許多。

「給我放首歌」,它會懂。雖然隨機出來的歌,不一定對你的胃口。

如果想精確一點,需要一點技巧。

最直接的方式是明確地說出你喜歡的歌手名字或者歌名,只要曲庫里有,它都可以正常播放出來。試試讓小愛同學播放雷軍的另外一首《 MI,MI,MI 》。

小愛同學也可以識別爵士、搖滾、流行、鄉村,也可以點一個特定的風格,比如「放些歡快的歌」,幾秒鐘之後你會聽到「跟著我左手右手一個慢動作,右手左手慢動作重播。」

一旦你的指令描述模糊點,小愛同學大部分推薦的歌曲完全取決於接入曲庫的熱門榜單。

小愛同學接入了蝦米音樂、小米音樂等多家音樂應用的曲庫。但是你並不能把你在應用里收藏的歌單導入到小米 AI 應用里。如果你是這些音樂應用長期的用戶,習慣在應用里收藏歌曲,暫時還不能指望小愛同學因此學會你的喜好。

小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

小米 AI app 的音樂播放和技能中心界面

音樂控制方面,小愛同學能很好地識別音量加減、暫停、播放等指令,但和放歌一樣,你需要明確地說出「小愛同學,暫停播放」這種指令。

智能音箱能識別一些日常的口語,如果播放的歌曲實在難聽,你可以大吼一聲「閉嘴」試試。我們也曾告訴它「小愛同學,好難聽啊」,它懂了。

但是許多從人的角度理解並不複雜的指令,智能音箱因為語義理解的關係,常常會鬧笑話。

比如我們對小愛同學說「換一首不同的歌」,你會聽到它開始播放《不同》。如果你接下來說「小愛同學,換一首歌」,它的反應則是換了一首也叫《不同》的歌。

想要換歌,最方便地是和它說,「小愛同學,我不喜歡這首歌」。

音質上,小米 AI 音箱自稱有大腔體的低音以及底部反射錐的設計,但實際上,差不多也就是你花 299 元可以期待的效果。

總的來說,如果只是回到家裡想隨便聽一些音樂來放鬆,或者在聚會、遊戲的時候來一點音樂助興,智能音箱的音樂播放能力看上去可以滿足要求了。

而且,你也不用擔心突然從音箱里傳來新消息的提示聲或者急促的電話鈴聲打斷音樂。

「小愛同學,除了唱歌,你還會做什麼?」

「暫時沒有找到《還會做什麼?》這首歌。」

智能音箱內置的語音助手很容易讓人想起《鋼鐵俠》里的虛擬助手賈維斯,你只需要和它說說話,天上地下的事它都幫你處理好了。

但是現在,你還不能對智能音箱要求那麼高。

目前每一款智能音箱都在不斷增加對於查詢路況、了解天氣、收聽電台等生活服務來提高自己的智能感,但瓶頸還是在語義識別上,功能細節也都或多或少不夠完美。

  • 鬧鐘提醒

這是比較實用的功能,你可以設定明天早上 8 點叫你起床,或是 20 分鐘后提醒你取下面膜。

但它只能按照基本語義設定提醒。如果你需要它來提醒你明天早上 8 點的飛機,它只會到了第二天早上 8 點提醒你乘坐飛機,而不會像 Google 的音箱一樣自動拿到你的航班號,根據路況提醒你幾點出發。

另外,你無法用語音刪除設置好的鬧鐘,如果你想取消錯誤設置的鬧鈴,你只會聽到它又一次告訴你,已經為你設置好該鬧鐘了。

正確識別的問法:「小愛同學,提醒我 20 分鐘后拿掉面膜。」

無法識別的問法:「小愛同學,不用提醒我晚上 10 點吃藥。」

  • 單位換算

單位換算或許並不常用,但是隨口問一下小愛同學,起碼也省了打開手機或者電腦搜索的時間。匯率換算也是一樣,網購時了解下當地的匯率還挺方便。

但是它還識別不了比特幣。

  • 查詢信息

你可以問它,這是什麼,但是它不是每次都能解答你。小愛同學播放的答案來自百度百科中對應詞條的標題和正文第一段話。考慮到百度百科的質量,這不是什麼好體驗。

  • 看天氣

小愛同學可以很快捷地查詢到天氣信息。不只是陰晴雨雪,還可以查詢值得關注的空氣質量,PM2.5 指數信息。

只是 PM 2.5 指數 70 左右的話,它都會告訴你:「北京今天沒有霧霾。」並不會說具體數值。

天氣功能也比較智能,能聽懂「今天下午會下雨么?」

天氣可能也會是你最常聽到的回復之一。當你開始問它像「北京最近有什麼熱門電影正在上映」這類它暫時還無法回答的問題時,它的反應就是重複播報一遍天氣信息。

  • 查詢路況

小愛同學是唯一提供路況查詢的智能音箱。但這個功能的限制也很多。

在我們的測試中,你需要先在手機上設置家和公司的地址,然後以這兩處為起點獲取公交或者駕車的出行時間,以及大致的到達時間。如果想知道其他兩地之間的交通情況,只能聽小愛同學為你播放從家到這些地方的出行時間了。

而且小愛同學還不能每天定時為你播報路況信息,你能做的只能是每次出門前問它一遍。

正確識別的問法:「小愛同學,從家到望京需要多長時間?」

無法識別的問法:「小愛同學,從三里屯到 798 要多長時間?」

  • 股票信息,還是自己查吧

股票信息查詢功能更不完善,小愛同學只能播放股票價格和股價變化情況。

如果你問它貴州茅台的股價,它只會回答說,」貴州茅台的股價收盤價格是 492 元,漲跌幅度為 0.94%。 」你無從知道,這個股價到底是漲了還是跌了。

我們也嘗試查詢已經連續停牌許久的樂視,小愛同學可以正確找到樂視網,在交易時段它會告訴你樂視當前已停牌,但如果你在非交易時段,它只會播出很久以前樂視還沒停牌時的股價,並不會說已經停牌。

至於投資常會考慮的標普 500 之類的指數漲跌,它也是聽不懂的。

正確識別的問法:「小愛同學,今天樂視的股價是多少?」

其它功能:

  • 笑話,既不好笑,也不冷。「小愛同學,說個不太冷的笑話吧?」

  • 播放新聞,直接播放喜馬拉雅的新聞音頻。「小愛同學,最新有什麼新聞?」

  • 哄孩子,會學大象、豬等動物的叫聲。但不全。「小愛同學,大象是怎麼叫的?」

    我們嘗試下來,最常用的是鬧鐘、提醒和換算,只要指令清晰,都可以實現。

    至於了解天氣、查詢詞條、收聽新聞、電台,聽一聽笑話,雖然基本可以完成,但是內容都受限於接入的平台或者信息抓取的網站。

    無論是好用還是沒有意義的功能,在發出語音指令時,你需要完全按照小愛同學能夠理解的方式發出明確的指令,才能獲得清晰的反饋。

    錯了幾次,多少都會有一種挫敗感。

    這些音箱需要學習來掌握技能。而你作為用戶,也得學習才知道怎麼讓它聽懂。所以,它依然是極客的玩具。

    「小愛同學,2 小時后關閉空調。」

    「好的,空調已關閉。」

    今天中國最完善的智能傢具系統來自小米米家。小米自己投資的公司做了從插座、空調、凈化器、電飯煲在內的數十款智能家居產品,加上接入的合作廠商,米家系統可以選擇的智能家居產品有數百款。

    考慮到目前的智能家居用處不大,大部分定價在幾十塊、一百多的小米產品更適合體驗。支持亞馬遜 Echo 的一個 Nest 智能攝像頭差不多夠買 20 件小米智能家居產品。

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    Nest 前不久推出的 Cam IQ 攝像頭,支持 Alexa 語音助手

    我們測試的智能家居設備包括可以調亮度的飛利浦檯燈、小米空氣凈化器、米家電飯煲、可以控制任何空調的米家空調伴侶、智能插座。

    這些設備都需要先接入米家自己的應用,然後授權給小米 AI 的應用才能通過音箱控制。

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    米家 app 中部分小米的智能家居設備,及語音控制授權界面

    對於大部分產品,音箱能控制的是開關和簡單的模式切換。

    比如空調,你不用掏手機或者遙控器就能一句話讓它開關,或者切換製冷、制熱。但目前手機應用里可以控制的定時開關等功能,音箱還聽不懂。

    燈也是,可以一句話讓它關閉,但不能啟動護眼模式等具體功能。

    空氣凈化器可以一句話進入睡眠模式,降低轉速。但凈化器本來就可以根據 PM2.5 情況自動開關,這比用音箱控制方便得多。

    同樣多此一舉的還有用語音控制電飯煲。

    在真實生活中,要用電飯煲煮飯,怎麼都得自己去放好水米,順手就可以打開開關、開始煮飯,基本不存在語音來控制它的場景。跟語音切換電飯煲的精煮/快煮等模式相比,遠程啟動和預約煮飯更實用。加上電飯煲沒法感知電飯煲里有沒有東西,你告訴它開始煮飯,電飯煲里什麼也沒有也會直接開始燒。

    簡單說,你用音箱控制,能做到的都是智能家居的手機應用功能的子集,唯一的區別就是你無須打開手機。

    按照小米官方宣傳片里的設想,早晨醒來,對音箱說一句「早上好」,小愛同學會自動播報天氣、拉開電動窗帘、電熱水器開始燒水、提醒路況和限行信息,甚至還可以接通煮蛋器電源幫忙做早餐。

    在過去,這些操作全部都要手動完成。有了零零散散的智能家居產品之後,你需要更頻繁地拿起手機,在對應的 app 里按一堆按鈕,也不算方便。

    而小愛同學則作為特定場景下的指揮中心,可以將這些設備的開關和工作狀態自動化,免去了不少自己動手的麻煩。但這個功能還沒開放。

    此外如果同時連接的米家設備很多,小愛同學的自動化場景會在一定幾率下出現某些設備控制失敗的情況。

    一句話就能關燈、關空調是挺方便的,但這也不能讓目前並不很實用的智能家居變得特別實用。

    「我要包郵的。」

    「您沒有回答我的問題,我先退出了。」

    天貓精靈,是阿里雲人工智慧實驗室研發出的一款智能音箱。用「你好天貓」或「天貓精靈」兩組詞都可以喚醒它,還能通過語音在淘寶上買東西。

    大聲說出這兩個詞都比較奇怪,家裡不只一個人的話,你可能會覺得不便。

    外觀上看,這款純黑色的柱狀音箱除了小巧輕便以外沒什麼特別。作為放在家裡不用隨身帶走的音箱,過於輕便往往只意味著音質差。

    跟小米 AI 音箱不同,天貓精靈的 LED 燈帶藏在了音箱的下方,被喚醒的時候會閃爍白光,但沒有聲音反饋。

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    499 元的天貓精靈

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    天貓精靈的 LED 呼吸燈位於底部

    在我們測試的這段時間裡,由於毫無聽覺反饋,常常需要專門望一眼才知道是否成功喚醒。這應該算是產品設計上考慮欠妥的一點。

    天貓精靈的機身主體同樣是普通的塑料,頂部採用 6 麥克風喚醒陣列設計,中心是麥克風靜音按鍵,腔體內部僅有一枚 5W 的揚聲器,音質並不理想。

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    在只部署了 5G Wi-Fi 的好奇心日報北京辦公室,天貓精靈要開手機熱點才能聯網。

    如果你習慣使用 5GHz 的 Wi-Fi 網路,那麼給天貓精靈配網很可能會遇到麻煩。這款音箱只支持 2.4GHz 頻段的無線網路。工程師的回應是,考慮到室內 2.4GHz 比 5GHz 擁有更強的穿牆能力,因此採用了一枚單頻段 Wi-Fi 晶元。不是很有道理。

    在沒有 2.4GHz 無線網的情況下, 你必須拿手機開熱點才能用上天貓精靈。

    它的重點功能是購物。為了解決支付難題,阿里雲人工智慧實驗室專門為天貓精靈開發了聲紋支付技術,你可以直接用語音下單付款。

    但是,能買到什麼,才是難題。

    在我們的實際體驗中,單單是挑選商品就能有非常強的挫敗感。比如說,天貓精靈,我要買零食。這位人工智慧助手會回答:「為您推薦天貓超市的樂事薯片三連罐裝,售價 19.9 元,暫不包郵。」

    但天貓精靈沒有告訴我這三連罐分別是什麼味道的薯片。用其它類別的商品做測試差不多也是這樣的結果。

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    天貓精靈給我推薦的樂事薯片

    比如買洗衣粉。第一次,天貓精靈為我挑選了奧妙的一款洗衣粉,但不包郵。我接著下口令說,換成包郵的,天貓精靈卻隨即表示「您沒有回答我問題,我先退出了」。

    天貓精靈雖然可以根據語音信息推薦商品,但它既不會詳細介紹商品信息(比如外觀顏色、款式等),也不支持語音挑選。

    以山地車為例,我對天貓精靈說想要買一輛山地車,它先給推薦了一款 27 變速的永久,紅黑配色。你說「換一種顏色」,它索性連車都換掉,推薦了另一輛新的捷安特。

    也就是說,天貓精靈的語音購物,既不支持選擇包郵商品,也不能更改商品規格,雲端推薦什麼就是什麼。在不清楚商品規格的情況下,基本不會有人貿然下單。

    以目前天貓精靈的智力水平,對於絕大部分商品,它最多也只是添加到購物車,完成購買還是得打開手機。

    標準化的商品,比如優衣庫的襪子,可能就比較適合直接購買。但當一位男性記者說要買一雙優衣庫的襪子的時候,它推薦了一套女士襪。

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    天貓精靈的技能中心,以及它為好奇心日報男記者推薦女裝襪子的截圖。

    天貓精靈在用戶數據層面已經跟淘寶的賬號體系打通。一旦用淘寶賬號登錄了天貓精靈 app,所有的歷史購買記錄、搜索和收藏記錄等數據理論上都可以為天貓精靈所用,而實際並非如此。

    為確保不會被人隨便下單。天貓精靈在購物支付時會需要錄入本人的聲紋,即「天貓精靈+隨機的四個阿拉伯數字」。

    當你發出指令說天貓精靈幫我充 100 元話費的時候,音箱會向你確認是否為 1xx 的手機號充值 100 元?確認號碼無誤之後,就會進入聲紋驗證環節。

    你必須處在一個安靜的環境中,再按照音箱的提示說出「天貓精靈+四個阿拉伯數字」。驗證成功后,它會自動從你的支付寶自動扣除 100 元,扣款順序以默認設置為準。

    在我用音箱充話費的幾次嘗試中,聲紋驗證環節最容易出差錯。這個過程對背景噪音非常敏感,室內環境中的貓叫、掃地機器人工作等聲音都會影響驗證。

    除了充話費,天貓精靈還能幫忙叫外賣。不過大概只有當你味蕾失效的時候,才會習慣這樣的外賣。比如天貓精靈在《好奇心日報》北京辦公室會推薦國貿附近的庭尚客牛肉湯,優惠后價格 31 元,號稱是附近好評率最高的外賣。

    如果你不想吃牛肉湯,就無法讓天貓精靈更換這家餐館提供的其它菜品。

    唯一方便的是再點一次昨天點過的菜。如果你每天只吃相同的外賣,是挺方便的。

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    除了放音樂以外,它們更多還是極客的玩具

    智能音箱的火熱主要來自亞馬遜 Echo 令人意外的成功。

    按照摩根士丹利分析師的預測,從 2015 年年中截止到 2016 年 12 月 1 日,亞馬遜共賣出了 1100 萬台 Echo 音箱,超過 1000 萬台來自美國市場。

    這意味著,平均每 7-8 個美國家庭中就有 1 個購買了 Echo。iPad 之後,還沒有任何一個新類型的智能產品獲得過如此的成功。

    Echo 成功之後,被亞馬遜當成了關於人工智慧的未來故事,將它描繪為一個不依賴智能手機的入口。它的廣告開始談購物、談智能家居。甚至因為 Echo,亞馬遜也成功推進了它做了十幾年卻沒有起色的音樂服務。

    智能手機已經基本停止增長,一個新的入口意味著新的增長。從 Google、蘋果,到國內的大公司京東、阿里、小米再到各路創業公司,都做起了智能音箱生意。

    從基本造型,搭配的手機應用,再到燈帶乃至燈光顏色的設計,你都能在國內這幾款音箱上看到亞馬遜的影子。

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    Amazon Echo | 圖片來自 BI

    做一個智能音箱並不是很難,中國擁有智能音箱需要的全部生產要素。從麥克風陣列、全頻發聲單元、到遠場識別演演算法、自然語言處理,所有的方案和供應商都是現成的。

    這些音箱放音樂也都比藍牙音箱方便。你可以一句話放歌,而且不會被微信通知打斷。現在的體驗不足也會隨著軟體升級而解決。

    但做一個不只讓人聽音樂的智能音箱就是另一回事了。

    智能家居里,音箱能做的還是一些非常簡單的事。而且真正有意義的智能家居本該不需要你操心,比如霾重了就自動開凈化器。你起床了就自動拉窗帘。

    今天幾家公司的智能家居平台還需要你自己花時間像搭積木一樣設置一個一個產品,折騰上幾小時讓以後更方便一些。聽上去似乎合理,但沒有多少人會這麼干。

    音箱只是省去了點屏幕的那一步,關個燈還算方便。但整個系統的問題並沒有被音箱解決,它也不會被音箱解決。

    至於購物,刷淘寶是很多人的習慣,而追求效率的話直接在淘寶、京東的應用里才最快。

    只有當你想逗音箱玩,或者想被音箱耍著玩的時候,才會用它「購物」。但就像 Siri 那樣,和音箱玩耍的興奮會很快過去。

    事實上,根據早先對於亞馬遜 Echo 用戶的調查,它的上千種功能里,超過 1/4 用戶會用的功能只有三個:放音樂、開關燈、設鬧鐘。

    其它功能,還只是極客的玩具。像 Siri,這些功能會讓人興奮一會兒,但也只是一會兒。

    題圖:作者拍攝

    小米、阿里智能音箱體驗,它們到底是下一個「入口」,還是 Siri 一樣的玩具?

    《讀書》,一本提出「讀書無禁區」的雜誌啟蒙了兩代中國人 | 雜誌往事②