閱讀168 返回首頁    go 機器人


新藥研發的AI時代:人工智能帶來的真正衝擊是什麼?

編者按:目前,藥物開發中最熱門的新領域之一是使用人工智能(AI)。許多人認為,藥物研究和實驗設計中的AI應用將十分有吸引力,從而更快地交付新的療法。AI當然是一個引人注目的做法,盡管它仍然要證明自己。

在這篇文章中,我們將讀到Numerate公司首席執行官Guido Lanza博士的看法。他認為AI可以產生最大影響的領域是真正的學習環路。在未來的三到五年內,AI會被應用到整個醫藥行業。這意味著沒有經過各種AI驅動模型(包括預測的動物毒性,預測性人體毒性,預測性PK指數等)研究的候選藥物將沒法進入臨床試驗。

Numerate是一家開創性的AI公司,采用新型機器學習算法,致力於克服小分子藥物發現的主要挑戰。在心血管,神經退行性和癌症等疾病領域,采用傳統的藥物研發方法難以產生符合所有藥物標準的先導化合物。因此,Numerate正在利用AI與傳統的藥物化學方法結合,預測候選藥物成功與失敗的因素。

Numerate的總裁兼首席執行官Guido Lanza博士曾擔任Pharmix公司聯合創始人兼首席技術官,2006年入選《Business Week》“30歲以下最佳青年科技創業家”。

您如何描述AI領域的公司境況? 它們大多是初創企業,還是Google和Intel這樣的大數據公司?

Guido Lanza博士:這個領域的公司分布很平均,既有Numerate,Insilico Medicine,Berg Health和NuMedii這樣的創業公司,也有GE和IBM這樣的大公司。值得注意的是,各公司之間的開發能力重疊性相對較小。這個行業數據過剩,算法不足已經持續了很長時間, AI在可預見的將來會麵臨很多問題。

106家改變醫療行業的AI公司,紅色方框內是從事新藥開發的AI公司(圖片來源:CB Insights)

您的公司與其他利用AI進行藥物研發的公司有什麼不同? 你們怎麼應用AI?

Guido Lanza博士:Numerate的第一個最明顯的區別就是我們成立很久了。在沒有人關注AI的時候,我們已經建立了一家AI技術驅動的公司。我們的初創團隊裏有計算機科學家和新藥研發人員,他們在臨床和市場上都有化合物。這迫使我們在很大程度上隱藏了人工智能的部分,並以更為傳統的平台公司方式開展業務,圍繞以服務和研發合作為重點的合作夥伴關係。這個商業模式使我們能夠在10年的時間裏投資了近5000萬美元建立了我們的技術平台,其中大部分是非稀釋性的資金。

從科學的角度來看,我們的差異化在於轉化能力。首先,我們能夠使用非常小的數據集來解決新興的生物學問題,即使這些數據不適合用深入學習的方法進行研究。二,我們的建模是基於3D配體信息,不需要化合物結構信息。這些能力使我們的機器學習算法能夠解決表型驅動的藥物研發難題,這種研發通常是低通量,高內涵的生物學問題。

另一個轉化能力就是我們的ADME和毒性預測功能。在這方麵,我們投資了1000多萬美元,其中包括與美國國防部防威脅減少局(DTRA)的大型合同,以建立和驗證一套係統,可能將先導物快速轉化為臨床候選藥物。今天,我們與製藥公司的許多合作都基於這一能力,其獨特之處在於能夠從過去的所有研發項目中學習,為未來的每一個化學設計和候選藥物選擇提供決策。

AI將如何改變藥物研發和臨床研究?

Guido Lanza博士:十多年來,醫藥行業一直在努力通過各種計算方法來解決藥物研發的成本和時間問題。顯然,跟使用人力,以實驗室為中心的傳統藥物研發方法相比,這也是AI的一個好處。然而,專注於計算方麵會錯過AI影響醫藥行業麵臨的最大挑戰——增加基礎生物學發現到患者應用的成果轉化率。

在最早階段,AI麵臨的關鍵挑戰是從相對較小的數據集中提取大量信息。例如,我們的平台使我們能夠非常快速地將學術研究的的實驗(特點是數據很少,低通量,高內涵)轉化為完整的先導物優化階段的項目。我們與Gladstone研究所合作開展了這項工作,現在開始與加州大學洛杉磯分校(UCLA)和梅奧診所(Mayo Clinic)進行了幾個項目。

AI麵臨的第二個挑戰是整合單個項目產生的大量數據(例如組學omics數據)。在這方麵,像Berg Health這樣的公司能夠集成大量數據來推動程序具有更多的可預測性。還有組合應用NLP(神經語言程序設計),以利用整體的生物學知識來做決策,從而能夠解釋結果,發現不可見的關聯——例如沃森機器人和Benevolent(譯者注:一家領先的英國人工智能公司,關注健康和藥物開發)。

IBM的沃森已在真實世界中帶來的很大的影響(圖片來源:IBM)

然而,AI可以產生最大影響的領域是真正的學習環路,這個概念首次引入業界。所有的決策都可以從以前所有成功和失敗的經驗推倒出來,這個首次提出的想法另令人印象深刻。我們一直在建立AI算法來預測化合物的PK和毒性特征,但現在,很多公司首次願意分享他們的實驗數據,以便我們能利用這些數據推出結論。在未來六個月內,我們將與一到兩個大型製藥公司合作,未來將會有更多的合作出現。

AI最終會成為生物技術和製藥研發的基準嗎?如果是的話,還有多久實現?

Guido Lanza博士:在未來的三到五年內,AI算法會被應用到整個行業。同時,根據AI提供的方法和價值,各方的接受程度會有所不同。

針對臨床前應用,基於NLP的方法仍然需要重新調整定位,但用來解釋結果將變得更常見。像我們公司用的、轉化基於表型信號的新興生物學的方法,會被許多生物科技公司用來啟動項目或者變得更加普遍,從而使製藥公司放棄今天傳統的藥物高通量篩選活動。同樣,基於結構的,模擬驅動的AI將繼續實現越來越多的目標。

大型製藥公司都在探索人工智能(AI)改善藥物發現工作的潛力(圖片來源:pmlive)

更重要的是,在未來的三到五年中,藥物研發將從孤立和匿名的成功轉向借助人工智能利用綜合知識的方式,無論是在公司內部研發或是在行業廣泛應用。這樣至少能避免一些(如果不是最多的)過去的研發錯誤。如果AI被證明比當前任何方法(PK,ADME,動物毒素,臨床安全性等)更好,那麼以完全傳統的方式進行藥物研發將變成一個明顯的競爭劣勢。這意味著在三到五年內,沒有經過各種AI驅動模型(包括預測的動物毒性,預測性人體毒性,預測性PK指數等)研究的候選藥物將沒法進入臨床試驗。

在製藥和生物技術行業藥物開發中使用AI的挑戰或障礙是什麼?

Guido Lanza博士:當前的挑戰主要在於文化。 首先,AI本質上意味著不可以解釋,而是更多地用作“黑匣子”。我經常聽到,為了使這些預測可信,科學家們想知道AI是如何做到的。我認為這是思考AI的錯誤方式。這些算法可以看到的數據中的信號對於人類而言太窄或太寬。因此,如果我們要求人工智能產生人為可解釋的結果,就可能限製AI去解決最有趣的問題。

這方麵一個很好的例子是從原始基因組序列預測人臉特征。Human Longevity公司表明,即使他們沒有潛在的發育生物學模型,這也是可行的。要求預測結果“可理解”可能會限製技術去尋找鼻子形狀或長度這樣簡單的遺傳標記,而這幾乎沒有價值。

AI預測技術能夠相當準確地“預測”基於基因組的個體麵部特征(圖片來源:Human Longevity)

另一個主要的文化挑戰關於數據。製藥公司需要進一步公開數據。這並不是說要分享他們目前正在開發的最熱門靶標的最新數據,而是指共享可用於預測未來藥物開發失敗的幾百萬個數據點。作為一家專注於預測性ADME和毒性研究超過10年的公司,我們意識到這是一個很大的問題,但是像GSK與ATOM這樣的公司正在引導和推動新的算法和方法的創建。

什麼樣的合作關係對您公司的發展很重要?

Guido Lanza博士:我們的客戶合作關係分為三個方麵。首先,我們與大型製藥公司合作建立購買產品線形式的合作。在這方麵,我們的合作夥伴,如武田(Takeda),會預先協商了由我們的AI平台產生的許可資產。此外,我們與大型製藥公司更多是圍繞數據而不是管線開展合作。在這些合作中,製藥公司共享數據,通常是PK /ADME或安全性數據,我們提供AI平台,這種模式使雙方都受益。最後一種類型是我們與學術機構的合作,我們希望延續有成功合作經驗的合作夥伴,如Gladstone研究所、UCLA和Mayo診所進行合作,以豐富我們自己的內部研發管線。這是獲得最有希望的新興生物學進步的一種方法,並使用我們的AI平台將項目轉化為可合作的資產。

生物製藥行業越來越重視與AI初創公司合作推動藥物發現(圖片來源:biopharmatrend)

一種關鍵的合作夥伴關係是通過高素質的CRO聯盟。我相信,在可預見的將來,人們不會(也不應該)接受AI的預測為真理。尤其是在這些方法得到改進之前,AI預測之後能夠減少實驗和驗證,才會使我們(和其他AI公司)實現價值。顯然,我們需要一個像藥明康德這樣一個在實驗室化學/生物學領域的合作夥伴,另外還可能會與臨床CRO形成合作關係。(實驗)證據的責任仍然在AI公司,未來也將是這樣。

您公司的商業模式與傳統的生物技術和製藥行業的創業公司有何不同?

Guido Lanza博士:傳統的生物技術和製藥創業公司一般側重於少數靶標或單一治療領域。我們更多地關注平台,以及如何更廣泛地改變行業。我們的業務模式著重於捕捉產出的價值——我們可以產生的化合物資產。我們還圍繞平台進行更多的關注數據/驗證而較少關注收入的合作類型,但是我們的收入來自於建立後期可以獲得轉讓收益的產品管線。我們一直在建立和擴展一係列管線,涵蓋了眾多治療領域(CNS,心血管代謝,炎症),它們來源於我們內部研發,學術合作,購買或賞金獵人交易。

運營一家AI初創公司,您有什麼經驗跟我們分享嗎?

Guido Lanza博士:作為一個剛剛創業的企業家,很容易認為解決技術障礙是最難的部分, 比如在我們這個領域如何生成算法和平台。我們很快就認識到,數據科學和商業問題同樣不容易。首先,你必須真正了解你的算法正在應用的數據。我們花費了數十年的時間來解決計算化學方麵稱為“訓練/測試悖論”的問題,就是在實驗室應用前景很好的模型在實際中表現不佳,盡管它們的回顧性很好。為了解決這些問題,了解數據、解決生物學(及其帶來的噪音)的混亂以及化學的挑戰(以及它們帶來的偏見)至關重要。

商業方麵,關鍵在於確保產品從科學和商業的角度來看真正具有價值。畢竟,向已知藥物中加入甲基可能會產生另一種活性化合物,但其價值幾乎為零。為了做到這一點,至關重要的是要有一個新藥研發團隊,真正了解對我們最終客戶——製藥公司而言,什麼東西才有價值。

AI與以前的計算生物學熱潮有什麼不同?

Guido Lanza博士:廣泛來說,AI廣泛影響了很多行業。計算機和數據存儲終於足夠便宜,以至於我們可以用正確的AI算法解決藥物研發的問題。這使得大型企業(IBM/GE)能夠開始影響醫藥行業,對目前封閉在製藥公司內部數據庫中的數據做點什麼。數十年來,醫藥行業一直努力解決研發生產率低的問題。過去十多年來,人們開始建立虛擬藥物發現初創公司。我們發展了Numerate的業務,專注於產品(化學和程序),卻把AI放在幕後,也很少談及我們的方法。如今,很高興我們的方法有機會對大型和小型公司更加開放。事實上,這個領域的初創企業正在蓬勃發展,部分原因是公共的數據量不斷增加,以及製藥公司越來越願意分享他們的數據。

另外,競爭環境也與10到15年前的計算生物學熱潮不一樣。我認為AI公司的創始人正在意識到,我們在大多數情況下並不是在相互競爭。首先,沒有人擁有向製藥銷售打包軟件/座位的模式。相反,我們專注於自己的產品管線或研發合作,這些合作不太可能直接相互競爭。 因此,真正意義上的社區正在形成,從分享聯係,提供參考和合作組織會議,這在五年前是聞所未聞的。

最後更新:2017-10-23 10:17:36

  上一篇:go 新零售、人工智能、共享經濟,寧波的百億獨角獸會在這裏出現嗎?
  下一篇:go 大數據、虛擬現實、人工智能,誰將顛覆音樂產業