TechRoomage

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

0 1

原標題:獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

在當今全球新興科技產業,談到勇於開放前瞻、布局未來的領導人除了 Tesla 創辦人 Elon Musk,肯定還會想到另一人,那就是亞馬遜(Amazon)創始人 Jeff Bezos。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨Jeff Bezos

從 One Click Shopping 一鍵購物打響名號,到機器人倉儲大軍、無人機送貨,以及 7×24 小時在全球 44 個區域運作、提供企業使用的雲端服務 Amazon Web Service(AWS),亞馬遜已經建立起一個網路帝國,儘管如此,這些似乎還是無法滿足 Jeff Bezos。

於是,打造嶄新購物體驗的 Amazo Go 、逆向操作開了實體書店 Amazon Books 、以 137 億美元高價收購有機生鮮超市 Whole Foods。自五歲就有對太空探險夢的他,也和鋼鐵俠一樣玩火箭發射,不惜在一年內賣出價值 10 億美元的亞馬遜股票,資助旗下的太空公司 Blue Origin。不論是那看不見的網路服務,還是摸得著的線下體驗,都讓人見識到他的野心。

內部文化重視科學、數據優先

亞馬遜之所以能成為傳奇,除了 Jeff Bezos 的領袖風格之外,以客戶至上(customer obsession)、數據優先(data driven)的企業文化絕對是關鍵。例如,在機器學習還不如當今火紅的時候,Jeff Bezos 在 2003 年招募了斯坦福大學出身的機器學習教授 Andreas Weigend 出任首席科學家,儘管 Andreas Weigend 只待了一年多就離職,後續他曾公開表示:「Bezos 最大的創新就是把數據擺在企業文化的中心。」

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨機器學習教授 Andreas Weigend

DT 君採訪到一位曾經任職於亞馬遜的華人機器學習科學家,不便具名的他透露,大體來說,公司內部運作分兩塊:零售(Retail)以及雲端服務 AWS。跟科技應用相關可以分為兩大板塊,一類是工程(engineering),另一類就是科學。亞馬遜內部文化非常看重科學研究,科學家是出了名的多——他們被賦予引導工程師執行方向的任務,因此地位也很高,工作就是完全專註於理論及前瞻科學的研究以及可行性論證。

他進一步指出,亞馬遜目前非常仰賴三種人,首先經濟學家,早期亞馬遜的電商業務相當倚重經濟學家的預測模型,但近年開始大量求職機器學習科學家研究科學家(Research Scientist)

實際上,科學家散落在各個單位。例如,在零售部門就有一個很大的科技團隊,其中最重要的職責就是供應鏈優化(supply chain optimization),可以說是研發方面最重要的部門之一。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

不過,也有整個團隊都是科學家,像是負責核心機器學習(Core ML)的部門規模至少超過百人,銷售預測的團隊也是百人以上,主要位在西雅圖、紐約、德國,而 AWS 科學家主要位於矽谷的 Palo Alto,近來備受矚目的智能語音助手 Alexa 則是由加州團隊負責,運作相當神秘,連內部員工也難窺一二。

AWS 才是 Amazon 的主要獲利來源

一般大眾對於亞馬遜的理解主要是電商,或者是智能音箱 Echo 及 Alexa。不過,打開亞馬遜財報就會發現,AWS 才是貢獻主要利潤的關鍵部門。根據亞馬遜最新一季財報(2017 年第二季),AWS 只佔整家公司凈收入的一成,但是其運營利潤(operating income)竟高達 9.16 億美元,遠遠領先北美電商(運營利潤為 4.36 億美元)——這已經是 AWS 連續五個季度超過北美電商。

更重要的是,不論是從營收或運營利潤來看,AWS 幾乎是呈現季季上揚的良好表現,可以說是為亞馬遜持續投入前瞻科技研發提供了穩定的財務支持。

本月19日,亞馬遜AWS宣布,從10月2日開始,將向使用EC2虛擬伺服器的客戶按照秒來收取費用,這意味著收費方式變得更加精緻化,讓客戶更加精確地核算成本,並且更加審慎的使用EC2。

毫無疑問,AWS 不僅是亞馬遜本身的聚寶盆,對全球諸多企業同樣有重要的影響力。今年二月初,位於弗吉尼亞州北部的雲端數據儲存服務 S3 數據中心停擺四小時,立刻造成上千個網站及手機 APP 無法正常運作。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨在雲服務市場,AWS 市佔排名第一,大幅領先其他業者。(圖片來源:Synergy Research Group)

現在,AWS 不只是要提供給企業穩定、具有擴充彈性的雲服務,更放眼人工智慧,將機器學習引入數據中心。因此,招募了眾多的科學家及研究員,在 AWS 里擁有博士學位的人就超過 1,000 位。

這其中不乏大神級的人物——例如被譽為 Java 之父的電腦科學家 James Gosling 剛在今年五月加入,其他的大牛還包括在雲端領域最具影響力人物之一的 Werner Vogels(現為亞馬遜 CTO)、機器學習界大師 Alex Smola(現為 AWS 機器學習總監)、曾在 Netflix 擔任雲端架構師 Adrian Cockcroft(現為 AWS 雲端架構副總裁)等。

不過,在男性為主的科技圈裡,有一顆耀眼的「女星」令人關注,那就是從加州大學爾灣分校(UC Irvine)副教授加入亞馬遜的 AWS 深度學習首席科學家 Anima Anandkumar。她率先投入張量(tensor)研究,加快機器學習的效率,她要為亞馬遜達到 AI 民主化的目標。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨AWS 深度學習首席科學家 Anima Anandkumar(圖片來源:DT 君)

首席科學家在做什麼?

深度學習可以說是當今最紅的名詞之一,那為什麼 AWS 需要使用深度學習?DT 君在矽谷專訪了負責擔任開發深度學習相關技術的 Anima Anandkumar,她告訴我們: Amazon AI 主要從事尖端研究,尤其是「解放雲服務的效率」,從基本的基礎研究開始,開發更好的演算法、優化的軟體框架(framework),讓使用者簡單方便地使用機器學習。她的工作一言以敝之:就是讓 AWS 服務跑得又快又好,設計可供客戶輕鬆使用的工具。

舉例來說,隨著人工智慧興起,企業對於使用電腦視覺識別,或是打造一個聊天機器人(chatbot)服務,進行文字轉語音服務等需求不斷提升,AWS 藉由將機器學習、深度學習引入數據中心,協助客戶快速實現目標。

目前,在大量的的深度學習框架中,TensorFlow 和 CNTK 分別是由 Google 和微軟所主導,Facebook 選擇 Caffe 2,為了不替對手抬高聲勢,AWS 選中了基於開放原始碼的 Apache MXNet 作為官方的深度學習框架,並且提供軟體程式碼、文檔,參與協助發展 MXNet 生態圈。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

MXNet 源於卡內基梅隆大學和華盛頓大學,具備高可擴展性、開發速度、移植性等特色,支援深度學習模型中的各種技術,包括卷積神經網路(CNN)、長短期記憶網路(LSTM)。另外,亞馬遜近期增加了動態圖界面 Gluon,讓開發者可以簡單、快速編程。

Anima Anandkumar 也透露了兩個她正在進行的專案,第一個是基於她先前的張量(tensor)研究。

當 Anima Anandkumar 加入 UC Irvine 擔任教職人員,那時候是大數據革命的開始,大家正在試圖找出能夠大規模處理數據的演演算法,以及做出有用的推論。她開始研究潛在變數(latent variables),「當資訊不夠多的時候,我們就無法發現一些被隱藏的因素,但是如果只是受限於運算能力的話,其實是可以被辨識出來的。」

矩陣最簡單的意義是行與列,張量(tensor)則是高級的矩陣擴張,通過張量可以讓多線性概念發展出很豐富的應用,擴展到更多維度,「如果你考慮一對變數之間的關係,這些就是成對的相關性,但是如果你想考慮三倍或更高倍數之間的關係,這就需要張量。」她在 AWS 就是在研究如何利用這一個特點來發現數據中的隱藏因子。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

舉幾個簡單的例子,A 和 B 在一個社群網路互結好友,可以通過這兩個人的共同興趣來推薦好友,通過這些演演算法能夠在一小時內,處理具有數百萬個節點的大型圖形。

另外,每一家企業都擁有大量的文件,假設不告訴你這些文件是什麼,你沒有先前的知識,那麼你該如何分類呢?最簡單的技術是聚類(clustering),但是在許多情況下,這些文件可以共享多個主題,像是新聞文章,它可能談論政治,也許是外交關係、科學等等。張量其中一個應用就是學習如何快速、自動分類文檔的模型。

在電腦科學里,經典的 Kruskal 演演算法是一種用來尋找最小生成樹的演演算法,也讓人知道能夠通過張量來識別,也就是唯一性定理(uniqueness theorem)。「從此以後,深度學習跟如何能夠大規模地解決非凸問題(non-convex problem)就產生了很深的關係。」

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

另一個正著手研究的項目則是利用張量來讓深度學習變得更有效率,可以在多個應用場景中獲得更好的性能。以及張量是否能解決強化學習(reinforcement learning)的問題,讓演演算法變得能具有適性化。智能的概念來自於能夠適應環境變化,但多數的學習演演算法卻是被動的。

商場沒有永遠的敵人

一項只是為了滿足內部使用的系統,卻發展成整家公司主要的獲利來源——這就是 AWS 的故事。

最初,亞馬遜原來是想要幫助第三方供應商如 Target 、 Marks & Spencer 在亞馬遜的電商引擎之上建立購物網站,所以推出一個 merchant.com 的服務,沒想到想得太簡單,導致平台一片混亂。

為了解決這問題,團隊決定改為採用應用程式介面(API)的方式,再加上,當時亞馬遜業務成長相當快,高層團隊卻發現,每個單位都在建立自己的系統。因此,內部決定打造一套通用的基礎架構服務,可以進行分散式管理,虛擬化伺服器及雲端資源等——這就是 AWS 的前身。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

到了 2006 年,亞馬遜開始正式對外提供 AWS 雲端服務,企業不必自己建機房、買硬體,只需要向亞馬遜承租即可——這種彈性的公有雲服務模式快速攻佔了市場。很快,微軟及 Google 紛紛加入戰局,分別推出 Microsoft Azure 及 Google Cloud Platform(GCP),三巨頭一直在雲端市場展開激烈競爭,業界也不時傳出微軟調降收費,要搶 AWS 的市佔率。

但前陣子有一個消息引起了騷動,就是亞馬遜語音助手 Alexa 與微軟旗下語音助手 Cortana 將在今年底互通,Echo 使用者可以對裝置說:Alexa,啟動 Cortana。儘管亞馬遜跟微軟在雲端市場斗得激烈,但商場沒有所謂的敵人,雙方在語音助手領域攜手有望做大市場。

對於 Alexa 與 Cortana 的合作,Anima Anandkumar 低調錶示:我不方便評論 Alexa,不過,亞馬遜文化是以顧客為中心,公司不考慮競爭對手,只專註於有利於客戶和生態圈的事。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨AWS 在全球的數據中心分佈(圖片來源: AWS)

三雲端巨頭全球基礎設施一覽

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

數據來源:DeepTech深科技整理

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨Microsoft Azure 全球數據中心分佈(圖片來源:Microsoft Azure)

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨Google Cloud Platform 全球數據中心分佈(圖片來源:GCP)

通過雲端實現 AI 民主化

雲端服務巨頭之間既競爭又合作,這很正常。不過,這些巨頭近期又不約而同喊出新的口號——那就是人工智慧民主化(Democratized AI)

微軟在去年十月的 Ignite 大會,喊出人工智慧民主化口號,Google 在今年三月的 Cloud Next 雲端大會,Google Cloud 首席科學家李飛飛以「讓 AI 民主化」為主題進行演說,而領導 Amazon AI 的 AWS 副總裁 Swami Subramanian 同樣宣布目標是實現人工智慧民主化。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

對此,Anima Anandkumar 表示,所謂民主化就是通過雲端服務解放 AI,讓人人都能取用。因此,AWS 會讓所有數據中心及服務都具備 AI 功能(AI enabled)。不過,目前只有部分數據中心支持。

這意味著,更多的企業需要接軌雲端以提升商業競爭力,因為現在機器學習也上了雲端,未來所有的事都會發生在雲端世界里,「我們策略是以 AI 為中心(AI centric)」。

除了上述提及深度學習演演算法及模型開發外,AWS 也率先推出 FPGA 運算服務 F1 Instances,讓客戶可以通過編程,為應用程式設計自訂的硬體加速。每個執行個體最多包含八個 FPGA,依照使用運算容量和時數來收費。

不過,這項服務目前僅在部分的數據中心提供,後續會推廣到全數的數據中心。

數學和舞蹈一樣優雅

為了實現 AI 民主化,亞馬遜除了協助企業使用者快速打造支持深度學習的應用,也展開了許多計劃,從基礎研究、教學、學生項目與非營利組織合作等,幫助他們跨越障礙。「不過,比較可惜的是,女性目前在這個領域還是比較少。」Anima Anandkumar 說。

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨谷歌雲團隊機器學習負責人李飛飛

的確,在科技產業,女性一直處於相對少數。Anima Anandkumar、李飛飛則是在數據科學、AI 領域的重要人物。

Anima Anandkumar 出生在一個理工家族,她的祖父是數學老師,母親是電子工程師,父親則是印度一流學府印度理工學院馬德拉斯分校(IIT Madras)的機械工程師,後來自己創業,常常帶著她到工廠晃晃,了解機器運作原理,「數學對我而言,很自然的就是一種交流和理解世界的語言。」

到了大學階段,她就讀 IIT Madras 的電機工程系,還跟同學一起向老師請願,希望成立機器人社團(Robotics Club),之後就到了美國康乃爾大學攻讀博士學位。

從求學到工作、從張量到機器學習,她始終與艱深的理論為伍,不過,她也是一名舞蹈家,從三歲就開始學印度傳統舞 Bharatnatyam 的她表示:「我一直認為,如果我不是在科技領域發展,應該就是一個舞者吧。」舞蹈和數學給了她一樣的感覺,「都是許多細節及韻律的整合,舞蹈通過編排組合達到優雅及美麗,這就跟數學一樣,我們利用基礎原理開發出新的演算法,我在裡頭看到了優雅。」

獨家 | 亞馬遜帝國的側面:最賺錢的部門如何解放AI

圖丨Anima Anandkumar從小學舞

隨著人工智慧在學界、行業界有所突破,很多國家也都積極提出相關政策。對此,Anima Anandkumar 認為,每個國家都有自己的應用點,不可諱言,目前美國在前端研究還是具有優勢。不過,世界的腳步變化快速,許多組織及學校都推出相關課程,隨著交流增加、教育推進,各個國家都可以累積 AI 實力。

與此同時,「印度和中國的優勢就是年輕一代非常優秀且積極」,例如她今年到上海的經驗,從打車到每一個生活環節,都讓她感受到網際網路的普及,這就是年輕一代的力量。「我想見證 AI 在世界的發展,比起先前其他的科技革命都更為普及,就是我的心愿」她說。

-End-

如果你發現文中有任何錯誤內容,請不吝發送通知讓我們知道並修改。『選取錯誤的文字片段後使按下Ctrl+Enter即可發送。』

Leave A Reply

Your email address will not be published.

Spelling error report

The following text will be sent to our editors: