AI 藥物發現:它如何改變遊戲規則
已發表: 2023-01-31AI 藥物發現呈爆炸式增長。
無論是否過度炒作,人工智能藥物發現的投資從 2014 年的 4.5 億美元躍升至 2021 年的 580 億美元。所有製藥巨頭,包括拜耳、阿斯利康、武田、賽諾菲、默克和輝瑞,都加大了支出,希望創造新時代的人工智能解決方案將為藥物發現過程帶來成本效益、速度和精確度。
長期以來,傳統的藥物發現一直是出了名的困難。 將一種新藥推向市場至少需要 10 年,耗資 13 億美元。 而這僅適用於在臨床試驗中取得成功的藥物(只有十分之一)。 因此,人們對尋找發現和設計藥物的新方法產生了興趣。
人工智能已經幫助確定了有前途的候選療法,而且不需要花費數年時間,而只需幾個月——在某些情況下,只需幾天。 在本文中,我們將探討 AI 藥物發現如何改變行業。 我們將研究成功案例和 AI 的優勢及其局限性。 我們走吧。
藥物是如何被發現的
藥物發現過程通常始於科學家確定體內與疾病發展有關的靶標,例如特定蛋白質或激素。 然後他們使用不同的方法來尋找可能的治療方法,其中包括以下方法。
- 篩選現有化合物:科學家可以篩選他們已經製造的化合物庫(天然產物或化學物質),以檢查它們是否與目標具有所需的相互作用。
- 從頭設計藥物:科學家可以使用計算機建模和模擬來開發可以完成這項工作的新型化合物。 這種方法用於製造小分子藥物,這些藥物是化學合成的化合物,大小小於 1,500 道爾頓。
- 生物製劑:研究人員還可以生成抗體、酶或蛋白質等生物分子來充當藥物。 這涉及從可與目標相互作用的活生物體中分離或合成分子。 與小分子相比,此類分子通常更大、更複雜。
- 重新利用:科學家們可以查看為其他目的而開發的化合物,看看它們是否具有治療相關疾病的潛力。
一旦發現潛在的候選藥物(稱為先導化合物),就會在細胞或動物中進行測試,然後進入包括三個階段的臨床試驗,從一小群健康志願者開始,然後進行到更大的患有具體情況。
人工智能是如何應用的
人工智能涵蓋各種技術和方法,涉及使用複雜的計算方法來模仿人類智能的要素,例如視覺感知、語音識別、決策制定和語言理解。
人工智能始於 1950 年代,只是一系列簡單的“如果,則規則”,並在開發出更複雜的算法後二十年後進入醫療保健領域。 自 2000 年代深度學習問世以來,人工智能在醫療保健領域的應用得到了擴展。 一些人工智能技術正在賦能藥物設計。
機器學習
機器學習 (ML) 側重於訓練計算機算法從數據中學習並提高其性能,而無需明確編程。
ML 解決方案包含各種分支,每個分支都有自己獨特的特徵和方法。 這些分支包括有監督和無監督學習,以及強化學習,在每個分支中都有用於實現特定目標的各種算法技術,例如線性回歸、神經網絡和支持向量機。 ML 有許多不同的應用領域,其中之一是 AI 藥物發現領域,它可以實現以下功能:
- 化合物的虛擬篩選以確定潛在的候選藥物
- 藥物療效和毒性的預測模型
- 確定藥物開發的新目標
- 分析從活生物體收集的大規模基因組和蛋白質組數據(例如 DNA 序列、基因表達水平、蛋白質結構)
- 優化藥物劑量和治療方案
- 患者對治療反應的預測模型
深度學習
深度學習 (DL) 是基於使用人工神經網絡 (ANN) 的 ML 的一個子集。 人工神經網絡由相互連接的節點或“神經元”組成,這些節點通過稱為“突觸”的通路連接。 與人腦一樣,這些神經元協同工作以處理信息並做出預測或決策。 神經網絡擁有的互連神經元層數越多,它就越“深”。
與只能在結構化數據中識別模式的監督和半監督學習算法不同,DL 模型能夠處理大量非結構化數據,並且可以在很少有人監督的情況下做出更高級的預測。
在 AI 藥物發現中,DL 用於:
- 改進了化合物庫的虛擬篩選,以識別更有可能與目標結合的命中
- 基於圖像的分析以了解與疾病相關的表型、疾病機製或藥物毒性
- 更準確地預測藥物如何在體內被吸收、分佈、代謝和排泄(藥代動力學特性)
- 預測藥物-靶標相互作用和結合親和力
- 預測佔目前確定的大部分藥物靶點的蛋白質結構
- 產生具有所需物理、化學和生物活性特性的新型類藥化合物
- 臨床試驗過程和方案設計的自動化。
自然語言處理
自然語言處理 (NLP) 依賴於語言學、數學和計算機科學技術的組合,包括 DL 模型,以分析、理解和生成人類語言。 AI 藥物發現研究通常使用 NLP 從結構化和非結構化數據中提取信息以完成以下任務:
- 科學文獻的文本挖掘,以確定化學/藥物實體、它們的目標和新的疾病相關途徑之間的關聯
- 從非結構化電子健康記錄 (EHR) 中提取結構化信息,例如患者人口統計、診斷和藥物治療
- 通過分析來自社交媒體、新聞文章和其他來源的文本數據來識別藥物不良事件
- 根據協議確定臨床試驗資格標準並將患者與試驗相匹配
- 藥物信息匯總
為什麼人工智能藥物發現現在是熱門話題
在過去幾年中,製藥行業的公司已採取措施將 AI 納入其研究方法。 這包括建立內部 AI 團隊,聘請 AI 醫療保健專業人員和數據分析師,支持專注於 AI 的初創公司,以及與技術公司或研究中心合作。 多種因素共同推動了這一趨勢。
計算機的日益強大和新的 AI 發展
最近的技術進步已經改變了 AI 藥物發現研究的傳統重點。
由於該行業的大多數公司(根據 BiopharmaTrend AI 報告,到 2022 年大約有 150 家)繼續專注於設計易於計算和大規模比較的小分子,人們對人工智能的新應用也越來越感興趣在藥物發現方面。
許多公司(其中 77 家)開始採用 AI 來設計生物製劑,其中 55 家正在發現指示疾病存在或進展的生物標誌物。 其他人專注於構建包羅萬象的 AI 藥物發現平台、識別新目標或創建本體——不同實體(如化合物、蛋白質和疾病)之間關係的結構化表示。
擴大對人工智能工具的訪問
由於人工智能人才短缺的情況沒有緩解的跡象,人工智能藥物發現的准入門檻實際上已經降低。 技術供應商和製藥巨頭正在發布越來越複雜的人工智能平台,包括隨時可用的無代碼和拖放系統,使非人工智能專家能夠將人工智能集成到他們的研究中。 這些發展在行業加速採用人工智能方面發揮著重要作用。
人工智能支持的成功案例
學術界和業界開展的 AI 藥物發現項目已經在藥物發現的整個價值鏈中取得了首批成功的成果。 示例包括以下內容:
- DeepMind 構建了人工智能係統 AlphaFold,它可以在幾秒鐘內根據蛋白質的一維氨基酸序列預測蛋白質的 3D 結構,而不是通常需要幾個月或幾年的時間。 該系統用於預測超過 2 億種屬於動物、植物、細菌、真菌和其他生物的蛋白質結構。
- 華盛頓大學的研究人員開發了一種深度學習模型,該模型使用遊戲計算機在 10 分鐘內計算出蛋白質結構。
- Deep Genomics利用AI技術篩選了2400多種疾病和100,000個突變,預測了Wilson病突變的確切致病機制,並在18個月內創造了DG12P1藥物。
- Aladdin 發布了專有的 AI 藥物發現平台,用於虛擬篩選、先導化合物命中、先導化合物優化和臨床前階段的商業用途。 該平台幫助 Aladdin 確定了許多可能用於治療與年齡有關的疾病的藥物化合物。
- IBM 開發了具有認知計算功能的 Watson 系統,製藥行業使用該系統將患者與適合其病情的臨床試驗相匹配。 在一項針對乳腺癌的臨床試驗中,該平台顯示入組人數增加了 80%,試驗匹配時間也減少了。
- AbCelera 用了不到三個月的時間開發出一種用於中和 COVID-19 病毒變體的單克隆抗體,並獲得美國食品和藥物管理局 (FDA) 的批准。
- 幾天后,BenevolentAI 將其知識圖譜與 AI 工具相結合,發現 baricitinib 是一種潛在的 COVID-19 治療方法。
- BioXcel Therapeutics 加速了右美托咪定作為精神分裂症和雙相情感障礙患者鎮靜劑的發現。 該公司在首次人體試驗後不到四年內就獲得了 FDA 批准其專有的右美托咪定 (IgalmiTM) 舌下膜。
- Exscientia 使用 AI 設計了三種小分子,以在兩年內進入臨床試驗。 這些分子旨在用於治療阿爾茨海默病精神病、強迫症和免疫腫瘤學。
- 2023 年初,Insilico 在第一個 AI 設計的新分子的 1 期臨床試驗中報告了積極的頂線結果,該分子是 AI 發現的治療特發性肺纖維化( IPF )的新靶點。
- 2021年,13個AI衍生生物藥進入臨床階段,治療領域包括COVID-19、腫瘤學、神經學等。
人工智能藥物發現的好處和挑戰
AI 是一種強大的工具,有望徹底改變製藥行業。 憑藉其分析大量數據和做出預測的能力,人工智能可以通過以下方式幫助研究人員克服長期阻礙藥物發現過程的障礙:
- 縮短髮現和臨床前階段的時間
- 更準確地預測藥物的療效和安全性
- 對藥物作用和疾病的新的、意想不到的見解
- 新的研究線和新的研發策略
- 通過更快的分析和自動化來節省成本。
據 Insider Intelligence 稱,AI 可為製藥行業節省高達 70% 的藥物發現成本。 人工智能在藥物發現方面的潛力確實令人興奮,但要充分利用它,首先需要解決一些障礙。
數據
談到人工智能,它總是歸結為輸入數據。 不允許整合的數據孤島和遺留系統是任何領域人工智能研究的重大障礙。 在製藥行業,問題可能更為突出。
製藥公司傳統上不善於共享數據,無論是來自臨床研究的結果還是去識別化的患者信息,而他們擁有的大量數據可能會為原始研究人員從未考慮過的問題提供答案。
當最終涉及共享數據時,它通常是不完整的、不一致的或有偏見的,就像用於預測對藥物發現至關重要的蛋白質-配體結合親和力的數據集一樣。 在某些情況下,數據甚至可能無法反映整個人群,並且 AI 模型在現實場景中可能存在不足。
複雜
生物系統的絕對複雜性使得 AI 支持的分析和預測此類系統行為的時間和空間變化變得困難。
生物系統中存在大量複雜和動態的相互作用,其中蛋白質、基因和細胞等每個元素都可以具有多種功能,並受到多種因素的影響,包括遺傳變異、環境條件和疾病狀態。
不同元素之間的相互作用也可以是非線性的,這意味著一個元素的微小變化可能導致整個系統發生巨大變化。 例如,控制細胞分裂的單個基因可能對腫瘤的生長產生很大影響,或者多種蛋白質之間的相互作用可能導致高度特異性和復雜結構的發展,例如細胞的細胞骨架。
另一個挑戰是缺乏合格的員工來處理人工智能藥物發現工具。
可解釋性
在 AI 藥物發現中使用神經網絡已經突破了可能的界限,但缺乏它們的可解釋性構成了重大挑戰。 被稱為黑匣子的人工智能模型可能會產生最準確的預測,但即使是工程師也無法解釋其背後的原因。 這在深度學習中尤其具有挑戰性,因為隨著層數的增加,理解每一層輸出的複雜性也會增加。
這種缺乏透明度會導致有缺陷的解決方案,並降低研究人員、醫療專業人員和監管機構對人工智能的信任。 為了應對這一挑戰,人們越來越需要開發可解釋、值得信賴的人工智能。
包起來
正在改變患者遊戲規則的新藥不斷湧現。
在 1980 年代 HIV 被確定為 AIDS 的原因後僅僅 15 年,製藥業就開發了一種多藥療法,可以讓受病毒影響的人過上正常的生活。 諾華的格列衛延長了白血病患者的生命。 來自 Vertex Pharmaceuticals 的 Incivek 使丙型肝炎治愈率提高了一倍。 默克公司的 Keytruda 可將黑色素瘤患者手術後癌症復發的風險降低 35%。
但並非所有新藥都是生而平等的。 最近在德國對 200 多種新藥進行的分析表明,只有 25% 的藥物比現有療法具有顯著優勢。 其餘藥物產生的益處很小或沒有,或者它們的影響不確定。
鑑於藥物發現的成本高昂和耗時的性質,製藥行業顯然需要重大變革。 這就是人工智能藥物發現可以發揮作用的地方。 除了加快就診時間之外,人工智能很有可能做出變革性的貢獻。
考慮您自己的 AI 藥物發現項目? 給我們寫信。 憑藉多年為醫療保健創建 AI 解決方案的經驗,我們是您需要的合作夥伴。
最初於 2023 年 1 月 27 日發佈在 https://itrexgroup.com。