撰文 | 藤子

2016 年感恩節前一天,美國一家跨國葯企的總部,這家葯企的負責人「驚呆了」,因為一家來自中國的成立不到兩年的小公司從盲測競爭中脫穎而出,以完美的結果 PK 掉了多家歐美研究機構。

這家成立不到兩年的小公司就是 XtalPi 晶泰科技,致力於將量子化學計算與人工智慧相關技術應用於藥物研發的關鍵環節。他們的切入點是化學藥物的「固相」研發――包括晶型、鹽、水合物的預測和篩選。

在藥物的研發流程中,對藥物固相的研究貫穿藥物發展始終,對一款葯的研發成功、順利上市發揮著至關重要的作用。因為,藥物的晶型等固相的選擇不僅關係著藥物的質量、決定後續的藥物製劑設計,實際上,以對創新葯為主的葯企來說,藥物的核心專利有效期通常是 20 年,然而,專利通常在藥物上市之前就已生效,大多數藥物在正式上架銷售後被核心專利保護的時間通常只有 7―12 年。而藥物固相專利可以使藥物專利保護延長 2―6 年。這對於年銷售額上十億美元的重磅藥物,無疑意味著巨大的價值。

將量化計算和 AI 用於藥物固相篩選與設計,晶泰科技擬降低不斷攀升的藥物研發成本

晶泰科技三位聯合創始人。

左起:AI 項目負責人賴力鵬、董事長溫書豪、CEO 馬健

晶型研究在藥物研發階段的重要性

在藥物工業,儘管每年二三十種的新葯上市,但這背後是超高的研發失敗率,以及漫長複雜的研發過程――僅臨床實驗失敗率就超過 90%。德勤曾經發布一份報告顯示,研發一款新葯的平均成本已達 15.4 億美元,耗時 14 年。複雜和艱難的研發過程使世界上很多國家都沒有生產創新葯的能力,而是以仿製葯為主。

研發階段非常複雜,分為基礎研發、臨床試驗、藥物審批三個階段。對於葯企來說,降低成本、提高效率則是硬需求。由於臨床試驗和藥物審批,既無法避免,也很難縮短時間,因此為了節約成本、提高效率,葯企們在基礎研發新技術的開發上一直在探索。

將量化計算和 AI 用於藥物固相篩選與設計,晶泰科技擬降低不斷攀升的藥物研發成本

藥物研發流程

基礎研發又分為藥物發現與臨床前研究,一般花費 3-6 年時間。首先要進行藥物靶標確認(target identification),確認引起疾病的因子或者病原體(pathogen)生存和增殖所必需的生物分子,也就是靶標。比如,人類免疫缺陷病毒(HIV)能導致艾滋病,而它增殖的必需生物分子是 HIV 蛋白酶,抑制這個蛋白酶的活性,就能破壞 HIV 病毒的增殖,進而阻止艾滋病的擴散。與其他酶類似,HIV 蛋白酶有一個活性位點,能與其他小分子相結合或作用。

確定靶標以後,葯企便開始尋找與這個靶標有較強結合能力的合適的分子。合成新的化合物或對現有化合物的結構進行改造和優化,再篩選出先導化合物(lead compound),也就是有活性的化合物。對活性不夠高、化學結構不穩定、毒性較大、藥物動力學性質不合理的先導化合物再進行優化,一旦藥物分子的化合物結構確定后,研究人員就要確定藥物晶型,這往往需要不同規模、時期、詳盡程度的數次實驗研究。

將量化計算和 AI 用於藥物固相篩選與設計,晶泰科技擬降低不斷攀升的藥物研發成本

藥物固相研究

然而,在形成晶體的過程中,藥物分子以及其他輔助成分(比如溶劑、鹽和其他小分子等)通常具有多種空間排列方式,不同排列方式則構成不同的晶型。比如,金剛石和石墨,都是碳的同素異形體,但因為晶體結構的不同,使他們成為了不同的物質,價值也天差地別。

那麼,即使是同一化學藥物分子,但如果固相不同,溶解度、熔點、溶出度、生物有效性等方面就可能會有顯著不同,而藥物的穩定性、生物利用度及療效都會受到影響,直接導致臨床試驗的成敗,有的穩定性問題甚至在藥物上架之後才被發現,而那時,藥物就不得不下架,給葯企造成不可挽回的經濟損失和品牌形象的損害。

世界著名葯企雅培就曾經發生過這樣的事情。1998 年,其抗艾滋藥物 Ritonavir(利托那韋)採用了晶型 form I,但在該藥物上市兩年後,發現 form I 會轉變成一種新的更穩定的晶型 form II。form II 的溶解度只有 form I 的四分之一,由於溶解度更差,生物可利用度遠低於預期。雅培不得不召回藥物,經濟損失超過 2.5 億美元。

將量子化學計算和人工智慧技術用於固相設計與篩選

在傳統藥物研發的流程中,採取實驗試錯的思路,通過 X 線衍射法、磁共振法、熱分析法等方式探索晶型,不但周期長,而且成本也很高。

「傳統的方式是完全通過實驗的,在成本、準確性、通量上都有很大的瓶頸存在;現在我們可以用一種很巧妙的物理數學演演算法進行精確的預測,還可以利用發展很快的雲端超級計算,極大提升整個研發過程的效率,讓這種演演算法能夠在藥物工業上得到真正的實現。」晶泰科技的聯合創始人兼董事長溫書豪認為,通過計算,藥物研究的時間可以大為縮短,成本大為減少,效率大為提高,成功率也大為提升。

具體來說,藥物分子及其形成的不同晶型是一個立體的三維結構,計算分子內部以及分子-分子之間的力可以得知熱力學穩定性。晶泰科技則通過量子化學計算,計算藥物分子的相互作用,評估所有的三維可能,從而進行準確的晶型預測,並與人工智慧的技術結合,為高性能科學計算提速,實現效率的進一步提升。

什麼是量子化學計算,晶泰科技聯合創始人兼 AI 研發負責人賴力鵬解釋道,計算是採用傳統計算機,但演演算法則是基於量子物理和量子化學的原理來構建。他表示,藥物相關的計算,要看分子之間,分子和蛋白質之間或者蛋白質之間的相互作用。計算如果需要很高精度,就需要量子力學的知識。他用初中學物理的方式來比喻這種量化計算思維:初中物理計算中,把地球和太陽各抽象成一個點,根據兩點之間的距離,計算他們之間的作用,而忽略地球上的山川河流這些微觀元素。

賴力鵬介紹,在粗略的分子動力學中,計算分子之間的相互作用力,也是如此,忽略微觀結構,都看成是一個點。但是這個分子間的相互作用力,是通過模擬了精確的電子和電子、電子和核等相互作用的量子化學計算得到的。按照晶體的現代點陣理論,構成晶體結構的原子、分子或離子都能抽象為幾何學上的點。這些沒有大小的點在空間排布形成的圖形叫做點陣,以此表示晶體中結構粒子的排布規律。

實際上,隨著計算機技術的發展,計算機也開始輔助藥物晶型的預測,一些開源程序可以基於藥物的分子結構,直接預測其可能的多晶型結構。但是該方法在藥物中的成功率普遍還較低,無法達到工業應用的標準。

賴力鵬認為,根據量子力學的思路,就比「點近似」考慮得更微觀,比如這個分子比那個分子多了一個原子,這個原子的微觀特徵與那個原子有些細微不同。如果考慮這些細小變化,計算精度則會更高。

對於人工智慧技術在藥物研發中的應用,賴力鵬介紹,一個基本的思路就是相似的藥物分子會具有相似的性質,因此演演算法研發的基礎是要科學、準確地量化和評價兩個候選分子的相似度。好的相似性描述可以大大提高預測的準確度。在真實情景中,這種相似度的描述要起決於具體的研究問題。因此,早先基於人工特徵定義(分子描述符)的 QSAR(Quantitative Structure-Activity Relationship)方法在一些特定的科研問題上就很難達到好的效果。但晶泰科技使用深度神經網路,將特徵提取的工作交由機器動態執行,進而獲得藥物研發過程中最關心的,諸如溶解度、毒性、蛋白質作用親和力、選擇性等特徵,最大限度獲得高準確度的預測。

通過量子化學計算的方法和深度學習的技術,晶泰科技能計算出化合物所有可能的晶體結構,再通過迭代優化,最終鎖定動力學中最具穩定性、最適合成藥的固相、晶型。並以人工智慧對藥物分子物理、化學性質的預測,在後續的研發中優先選擇那些藥物性質最有可能成功的候選和固相,從而降低研發決策中盲目、隨機的因素,以人工智慧的「先見之明」解決藥物研發的「後顧之憂」,讓研發科學家的研發決策更加有的放矢。

商業之路始於盲測獲勝

晶泰科技的創立之路始於波士頓的麻省理工學院,幾位創始人正是在麻省理工學院完成博士后研究時的同窗。

波士頓作為製藥業的「矽谷」,在劍橋地區、尤其是肯德廣場(Kendall Square)周邊聚集著大量來自全球的知名製藥企業與生物科技領域的創新企業、生命科學研究組織、研究型醫院,也有很多外國葯企將美國總部設置在波士頓的劍橋市,藉助與哈佛、麻省理工這些生命科學領域的老牌科研院校與相關人才的近便,掌握這一領域的前沿動態。可以說,作為「世界的藥物研發實驗室」的美國,其動力引擎就在波士頓/劍橋地區。

濃厚的製藥氛圍與完善的行業生態圈,再加上麻省理工學院的創業傳統,潛移默化地影響著晶泰科技的創業團隊。作為麻省理工的博士后,董事長溫書豪的主要研究方向為量子經典雜化和多尺度模擬,在求學期間,他一直在進行晶型能量排位的研究。這一技術在新材料設計的諸多領域都可以應用,他們決定切入藥物的研發,用這一演演算法提高藥物工業的研發效率。

「我們當初為什麼要做這個事情,就是符合這幾個方向:有地理位置的天然優勢原因,也看到工業界的痛點和需求, 但我們的最終決定還有社會的角度――這 一技術能加速仿製葯與創新葯的研發,使病人更快地用上價格更低的藥品。」溫書豪說。

在溫書豪的設想中,將人工智慧應用於藥物研發 ,以智能、精確的演演算法超越研發人員個人經驗的局限,能使成本降低、研發周 期縮短,藥物的價格也會更低,另一方面,能使藥物研發的效率提升,葯企的研發產能提高,從而能使患者更快地用上更多優質的葯。

2016年,晶泰科技受到某大型跨國葯企一線研發科學家的邀請,在詳盡而嚴苛的背景調查之後,獲得了葯企內部一個盲測機會――使用該企業內部的分子數據,讓晶泰科技用自己的演演算法預測藥物分子的固相,再跟他們已經合成的穩定晶體、固相做對比。

幾個月內,晶泰科技就完成了盲測,結果卻是百分之百吻合,從一同被測試的歐洲、美國頂級研究所中脫穎而出。這個結果使葯企對這支成立不久的中國團隊能做出這個成績大為震驚。

通過葯企的內部測試后,該企業提供的訂單數量以及與他們長期合作的熱情都超乎溫書豪的想象。「你要進入這個行業,就要看能為這個行業到底帶來什麼,做研究的要以獨特的角度切入創業,早期通過技術輸出的方式合作,有了技術就有更多的拓展機會。」溫書豪說道。

從晶型預測平台到藥物研發平台

2015 年 11 月,晶泰科技的藥物固相高精度篩選與設計雲平台上線,起初是基於亞馬遜 AWS 雲服務的雲平台,如今已經擴展到騰訊雲、阿里雲、谷歌雲,調配上百萬核的計算資源。據賴力鵬介紹,依託平台的演演算法,晶泰科技對每個藥物分子的計算中都會產生數百萬到數千萬的結構數據。之後,他們再通過人工智慧針對這些高質量的數據進行深度學習,在進行海量計算的初期預判不同晶體結構的堆積能量,從而大大減少能量計算的資源耗費,進一步提高演演算法的效率。

「這對我們更加準確地預測藥物分子的物理、化學性質起到重要的推進作用。」賴力鵬解釋說。這個平台目前已經服務於世界級最頂尖的葯企,並受到 一線研發科學家們 的一致推崇。

「我們把技術本身做到極致,然後把技術部署到雲端或者跨雲端的平台,使全世界的研髮型葯企都能方便地使用我們的技術,整體提升藥物工業的效率。」溫書豪說。

除了藥物固相設計與篩選雲平台之外,2017 年 7 月,晶泰科技推出了面向合作科研單位的人工智慧藥物研發平台 AtomPai。

之所以要推出 AtomPai,賴力鵬表示,團隊的靈感來源於某次跟製藥以及化工化學背景的朋友聊天時,朋友提起神經網路、自編碼器等等,但不知道如何將這些方式用在化學及醫藥研究上。同時,在研究當中,存在大量重複代碼開發,反覆造輪子的資源損耗。

為了將科研人員的創造性從重複、陌生的編碼工作釋放出來,賴力鵬表示,晶泰科技將化學醫學、製藥及其它研究領域相關常用的數據分析及預測的機器學習方法部署到 AtomPai,科研工作人員就能直接在平台上調用已經實現好的,包括邏輯回歸、主成分分析、支持向量機、神經網路在內的模型(已部署 30+的標準模型)進行數據分析,完成常規及複雜的數據分析任務。而如果他們有更深入的需求,這些研究人員則可以與晶泰科技進行細分項目的合作,實現針對性更強的數據分析與數據挖掘任務。更重要的是,科研人員在這個平台上可以實現高質量模型的分享與數據分析方法的交流,大大提高研發的效率。

目前,AtomPai 已面向合作科研單位與數據分析者發放邀請碼進行測試。據賴力鵬介紹,在未來一段時間,AtomPai 還將對更多的研發人員、科學家、學術工作者開放,在持續研發的過程中尋求廣泛合作,讓不會寫代碼的使用者也能根據自身需求建立高效的 AI 模型。

如今,晶泰科技已獲得騰訊、真格、峰瑞等投資機構數千萬元的 A 輪投資,並即將於近期完成來自國際知名投資機構數千萬美金的 B 輪融資,成為目前人工智慧結合製藥領域全球範圍內單筆金額最高的融資之一。

晶泰科技核心團隊

溫書豪,XtalPi 聯合創始人,董事長。中科院博士,加州大學、麻省理工博士后。主要研究方向為量子經典雜化、多尺度模擬。

馬健,XtalPi 聯合創始人,CEO。浙江大學物理系本科、博士,麻省理工學院博士后。主要研究方向為量子計算和生物系統中的量子動力學。

賴力鵬,XtalPi 聯合創始人,AI 項目負責人。北京大學物理學本科,芝加哥大學物理學博士及麻省理工學院博士后。主要研究方向為數學物理和計算物理,擁有豐富的程序設計經驗和團隊管理經驗。

將人工智慧用於藥物研發的其他初創企業(資料源自網路)

Atomwise

通過 IBM 超級計算機分析資料庫,使用深度學習神經網路分析化合物的構效關係,在藥物研發早期評估新葯風險,比如新葯的有效性以及安全性預測。

InSilico Medicine

使用生成式對抗網路 (GAN ) 發展、訓練新的分子結構的方法,構建藥物分子。不同於傳統製藥過程中,需要通過不斷實驗試錯來尋找先導化合物,而是讓 GAN 產生這樣的化合物分子,以此減少尋找有潛在藥物特性物質的時間和其他成本。

BenevolentAI

通過深度學習和自然語言處理技術理解和分析大量的生物科學資料,比如專利、基因組數據和所有生物醫學期刊和資料庫每天上傳的出版物,找出其中的關聯並提出相應的候選藥物,進一步篩選具有對某些特定疾病有效的分子結構,比如可用於神經退行性疾病但沒有心臟或肝臟副作用的分子。

Lantern Pharma

通過大數據與人工智慧技術提高藥物與癌症患者的匹配度,從而縮減新葯研發在臨床 2 期的周期與成本。 將量化計算和 AI 用於藥物固相篩選與設計,晶泰科技擬降低不斷攀升的藥物研發成本

LEAVE A REPLY

Please enter your comment!
Please enter your name here