導讀:移動網際網路時代即將落幕,嶄新的AI時代即將開啟!面對這樣一個變革大時代,BAT三巨頭之一的百度將如何實現戰略轉型,並構建出全新的AI開放平台與生態系統?作為百度AI驅動型新業務,DuerOS將在百度戰略轉型中扮演怎樣的角色?

《聲學在線》有幸採訪到百度度秘事業部總經理、DuerOS負責人景鯤,對以上問題進行了深度解讀。 景鯤相信,DuerOS承載了百度從「連接信息」到「喚醒萬物」的新使命,是基於AI技術打造的下一代人工智慧平台級產品。8月31日,在柏林IFA(柏林國際電子消費品展覽會)期間舉行的搭載DuerOS的TCL智能電視新品發布上,景鯤也表示,DuerOS將發掘長期市場機遇,為生態合作夥伴增添更廣闊的空間。

人物專訪 | 景鯤:開放是一種心態和氣度,這個時代需要標桿!

專訪人物 景鯤

景鯤:百度度秘事業部總經理,百度人工智慧產品委員會主席,NLP領域專家。曾歷任百度搜索公司產品委員會主席、大搜索總產品架構師,前微軟首席研發總監,是微軟小冰的創造者。目前,全面負責百度度秘和對話式人工智慧操作系統DuerOS。


談生態:百度DuerOS從底層服務入手打造AI時代的生態系統

(1)變革期需要大氣度,開放終究會打敗封閉

聲學在線:7月5日,百度AI開發者大會上,DuerOS開放平檯面向全球所有開發者亮相,作為AI時代的Android系統, DuerOS是AI時代開放賦能的生態系統。而當天阿里AILab實驗室也召開了一個小型發布會,推出的是一款智能音箱產品。作為國內兩個翹楚的科技巨頭,兩家作了截然不同的選擇,為什麼百度會選擇打造DuerOS一個大的生態系統,而不是從ToC消費電子產品入手?

景鯤: 在時代變革期需要有更大的氣度、更大的心態。開放是一種心態和氣度,就像百度AI開發者大會中,Robin在最後提到「開放終究會打敗封閉」!

社會的發展趨勢是變的彼此跟彼此有關係的,變成一個更加connected的社會。我們不應該形成一個封閉的系統,把一些東西封閉在自己的體系裡面。

在這種大的變革期,是需要有人來做基層的、底層的服務,才能夠支撐更多「有夢想的玩家」。從這個角度來講,我們覺得做生態是更有意思、更具有社會責任感、更加能夠推動整個時代的變革。

而且,從效果上來看,也有很好的成效。現在跟我們合作的夥伴非常多,無論是大的企業,還是優秀的中小創業者,甚至個人開發者。真正的開放賦能,是能夠讓大家基於我們的人工智慧的開放平台作出更好的產品——我覺得這正是百度的機會,也是百度的責任。

(2)做生態最關鍵是找好自己的位置

聲學在線:DuerOS要做AI時代的安卓系統,其本質是要共建新生態,而所有的操作系統在初期構建生態都是最艱難、最痛苦的。站在生態系統層面,DuerOS構建生態初期過程中遇到的最大的困難是什麼?又是如何迎接這些挑戰的?

景鯤: 構建生態的過程的初期是比較困難,但是不痛苦,因為你在實現自己的理想和夢想的過程中。兩三年前,做這個事情的時候,理解的人很少。到今天大家都在討論這件事情,其實我是有很大的成就感的。這個過程其實邁過了很多檻兒,越來越多的受眾、媒體都關注人工智慧、都來談語音交互,這是很讓人興奮的一件事。

的確,打造生態過程初期的確是困難的,初期主要的困難是如何協調幾方的合作。我們有用戶、有設備方、有方案商、有晶元企業、有內容方、有開發者……怎麼樣把大家放到一起冷啟動是一件比較困難的事情。

對於「冷啟動」做生態最關鍵的是如何找好自己的位置,以及你對外釋放的心態。找到了合適的位置之後,冷啟動會比較順利,否則處境很尷尬。在語音交互方面,國內像百度一樣有儲備的公司很多,但是,生態並不是很有活力。所以在這個位置上,你是不是有足夠開放的心態,是不是有足夠開放的能力,同時找到一個好的位置,這是攻克這個生態很重要的一環。

(3)扶持為主,謹慎補貼;開放賦能,體驗第一

聲學在線:提起構建生態,一定離不開促進生態進化的策略。目前,一些公司會推出一些促進普及的政策,比如成立基金補貼給下游參與平台建設的優秀開發者,百度DuerOS會採用什麼策略促進生態發展,也會推出相應的補貼政策嗎?

景鯤:我們主要以扶持為主。DuerOS的平台很大,平台合作企業也很多。從平台角度我們可以了解到誰有技術能力和有意願做這件事,且需要扶持。像這種公司我們會去傾斜資源扶持。

對於補貼,要看市場發展階段來決定。生態是以體驗為第一位的。如果體驗不太好的話,不能盲目的去做補貼。我們希望用一種更合適的方式推進產業的發展,不要讓它過熱,過熱大家反而會忽視用戶體驗,會傷害一些用戶。我們希望理性和感性相結合,共同推進這個產業往前走。

百度生態是開放賦能的一個生態。我們有肥沃的土壤,各種養分齊備。這塊土壤上的植物,該長成大樹的會慢慢長成大樹。如果你拚命的施肥催熟,對樹木本身也不好,我們希望以更健康的方式發展。

(4)選擇合作夥伴標準——品類標桿、行業示範、引領風向

聲學在線:DuerOS是整個行業參與完成的開放生態,需要眾多的合作夥伴和開發者共同參與。百度作為大公司,在選擇合作夥伴會有什麼樣的策略或者偏好?會傾向選擇自帶用戶流量的夥伴,還是偏好有技術內核的夥伴呢?

景鯤:我們會比較偏向於打引號的標桿客戶。這個時代是需要一些標桿、領頭羊衝到前面帶領著選擇生態,讓所有用戶看到技術和場景結合之後,能爆發出什麼樣的火花。

這個時候標桿客戶包含了很多,比如和TCL、聯想、國安廣視、極米等的合作,他們是電視領域的標桿、領頭羊,會帶給整個行業示範作用;個人開發者也是標桿的一種,並不是因為他們的流量多大、用戶有多少,而他們是代表了一批很有夢想,想把語音交互融入到自己生活里的一類人,這個示範作用也很大。

所以,更多的是看這個標桿客戶是不是有很強的代表性,有很強的輻射能力,能夠引領風向,能夠吸引更多的合作夥伴跟我們一起來做這件事情。


談語音:從「連接信息」到「喚醒萬物」,語音交互將無處不在

(1)語音是大勢所趨,未來是語音交互的時代

聲學在線:從PC網際網路時代到移動網際網路時代,搜索方式一直在不斷進化。而AI也是百度基於搜索引擎的核心技術自然進化的結果。您加入百度后,開創的引入了語音搜索、圖像搜索、對話式搜索等創新搜索交互方式,從以往的關鍵詞到現在的語音Freestyle,語音搜索會成為未來搜索的主流方式嗎?

景鯤:科技發展的基本趨勢是不變的。首先,對於交互而言,無論下一代搜索是什麼,它都是以更簡單、更自然的搜索方式,人和設備之間的交互變得越來越簡單,沒有門檻。無論視覺、語音,或者其他的搜索方式,肯定是這樣一種大趨勢。

人物專訪 | 景鯤:開放是一種心態和氣度,這個時代需要標桿!

百度DuerOS:話繁為簡

第二,未來的搜索和人機交互,肯定是雙向的,而不會是單向的。人跟機器表達,最高效的方式是用語音;而機器與人表達,最高效的方式是使用屏幕——圖像。所以,語音是一個趨勢。人跟設備之間的語音對話會變得越來越自然,所以未來應該是語音交互的時代。

現在,有的人還半信半疑,有的人可能還不確定,但是時代可能就是往往掌握在那些有理想、有願景、想把事情做成的人身上。

(2)不要著急搶風口,用戶體驗才是王道

聲學在線:在中國,智能音箱被小米、京東、阿里巴巴等巨頭押寶,儼然形成了搶佔人工智慧入口的大戰。也有人質疑智能音箱,認為其不會是一個現象級的產品。您如何看待入口這件事情?DuerOS在這個過程中會扮演什麼角色?

景鯤:我覺得最重要的是產品體驗,是用戶體驗,而不是搶風口。如果用戶體驗好,你去搶風口,就會站到一個合適的位置,拿到機會。而如果單純為了風口而去搶入口端,因為搶時間的原因,肯定沒有很深的打磨產品,反而會對品牌有一定的影響。

所以我們跟我們的合作夥伴說,如果我們推出一款基於DuerOS的設備產品,我們希望體驗是最好的,不要為了爭搶這幾個月的時間,盲目的透支自己的品牌。用戶體驗絕對是第一優先順序,無論是不是風口,如果體驗做好了,絕對就是風口,如果體驗不好,風口也不是你的。

DuerOS現在之所以賦能這麼多合作企業,就是希望每一個設備都是可以交互的,語音交互無處不在,喚醒萬物,萬物都能夠對話,這是我們的願景。如果萬物都可以對話,這樣所有設備都是入口,大家都有機會。

產業是需要分工的,DuerOS的分工就是要把底層聽清,聽懂和滿足的能力做到絕對最好,配合產業鏈上下游發展。DuerOS是一個很開放的平台,很多第三方都在上面build skill。生態的發展是比較開放的好,從這個角度,我們把底層搭建好,上端開放給用戶,合作夥伴和開發者基於此做產品功能的深度定製,做他們擅長的技術攻關。這樣的話,我們有我們的競爭力,同時我們也跟整個產業上下游有一個清晰的分工,大家會有不同的收益

(3)最看好軟硬結合的創新,DuerOS服務於生態系統所有玩家

聲學在線:DuerOS是賦能AI時代的底層操作系統,要把底層聽懂的能力做到絕對最好。那麼,您認為現階段對於DuerOS來說,挑戰是什麼?DuerOS將在哪些應用領域突破創新?

景鯤:現在,很多合作企業已經跟我們走到一起了。對於DuerOS來講,我們現在最大的挑戰其實不再是接觸新客戶,更多的挑戰是:面對生態系統里這麼多玩家,怎麼把自己的工作做好,來滿足這些合作企業的需求。當星火燎原之勢展開之後,怎麼讓火勢更猛烈一些。

目前,對於DuerOS所在的領域,我們第一個看好的是軟硬結合的創新。其實,智能設備的發展是有起伏的。早期,設備能連接上手機就自稱為智能設備。其實它的交互是很複雜的。首先,在家裡找到手機就是很費勁的一件事,找到之後還要解密碼、打開App、選擇設備等等,還不如走到設備面前按一下更簡單。這是那個時代智能設備發展的挑戰。

現在使用語音,比你走到設備前更方便。比如說你躺在床上不想走,跟燈說讓它關燈,這個燈就關好了——這就是一個很自然的使用場景,我希望這種軟硬結合的創新更多一些。在家裡、在車裡,雙手被束縛、或者不希望用雙手去處理一些工作的時候,語音就可以發揮它的作用。

我們希望DuerOS作為底層的開放平台支持各種各樣的具體設備,無論是音箱,還是電視。這些設備,在我眼中它都是麥克風,我希望大家能養成一種習慣看到這個設備就跟它說話。

(4)分而治之,DuerOS要做支持所有應用的開放平台

聲學在線:您是NLP(自然語言處理)領域的專家,從微軟開始就推動NLP研究和應用的進展。您如何看待NLP領域的兩個子集——開放域聊天和任務型對話的?DuerOS又是如何處理這兩方面應用的技術挑戰?未來,DuerOS在NLP領域中又將承載哪些期望與使命?

景鯤:首先,做一個大而全的開放人機交互系統有很多挑戰,最大的挑戰在於對話控制。即使是單輪對話也會有挑戰,而在多輪對話的時候,需要結合上下文,理解整個情境。而用戶跟機器表達的時候,思維是跳躍性的,機器理解就會更有挑戰。

如何解決呢?我是學計算機出身的,策略就是分治原則,分而治之,把大問題變成小問題。我們把通用的人機交互進行切分,有的切分成開放域聊天,有的切分成任務型對話,有的切分成其他的。

開放域聊天要跟用戶產生真實的連接黏性,這方面技術挑戰是非常大的。現在也有一些公司把開放域聊天放到更多的垂直領域上去,比如說,做某一個垂直品類的聊天、甚至是某一個群體聊天,例如兒童。這也是分治原則,由一個大問題切分成小的問題。

任務型對話,其實有的時候是從聲控指令過渡來的,往往邊界比較清楚,解決起來更容易。所以,基本上是從最初的控制指令,慢慢變成讓用戶Freestyle的表達,這是一個逐步的由簡變難的過程。

從百度來講,DuerOS是一個大的開放式平台,對於任務型對話,就是指令型、控制型的這種表達是支持的。我們希望它能夠在很多實際場景中落地,解決用戶的痛點。而對於開放域聊天,對於某些特定的用戶,比如日本的宅男文化,比如小朋友跟機器人對話就喜歡跟湯姆貓聊天的模式,我們也希望有一些技術平台支持開放域聊天,我們對他們都會進行支持。

為什麼百度會去支持?第一,解決這些問題還是要數據足夠多,百度的數據足夠多。第二,百度永遠是站在技術的最前端。所以,對於現在來講有挑戰,但是未來潛力巨大的技術,我們也會有一些投入。短期和長期的都會有相應的技術儲備,只不過產品化的時間點不太一樣。

(5)標準與標配,未來語音交互無處不在

聲學在線:自從百度開發者大會之後,我們明顯感受到語音交互的重要性被再次劃線。 DuerOS戰略地位的上升,這是的戰略決策的結果,還是人工智慧發展的必然趨勢?百度會同國外巨頭微軟、亞馬遜等一樣,推出NLP領域的相關評測標準嗎?如果暢想5年後DuerOS的發展,您的期望是什麼?

景鯤:百度戰略一直都是持之以恆的進行的。對於語音對話自然交互的投入的時間和資源都非常大,這是百度主航道的業務的延伸,其實就是我們前面提到的搜索的進一步——下一代搜索。

標準方面我們還在內部的探討期,希望推出一個讓大家都比較認可的標準。標準之所以能成為標準,就是其他人要遵守、願意參與到其中。這涉及到一些具體執行規則的制定,現在我們還在討論過程中。

我們希望將來形成一種行業背書,讓用戶看到DuerOS的標識,就知道這個是經過測試,體驗穩定的設備。具體怎麼更進一步的開放標準,我們內部也還在討論過程當中。但是,百度已經在布局這件事了。

如果暢想5年後,我希望比較形象化一點,那個時候,我兒子估計8歲了,希望他能夠看到一個設備就想跟它去對話,我希望5年後達到那種程度。怎麼能夠讓用戶、讓普通老百姓認知到語音交互應該是標配,是應該具備的能力,這需要整個業內一起做這件事情的時候會更好。

希望未來每一個設備都是可以交互的,語音交互無處不在,喚醒萬物,萬物都能夠對話,這是我們的願景!