從藥物開發到營銷:大數據在製藥領域的潛力
已發表: 2023-08-01文章摘要:
- 製藥行業可以獲得大量數據:電子健康記錄、基因組信息、真實世界的證據等等。 所有這些數據結合起來就可以稱為大數據。 利用大數據中隱藏的模式可以為該行業帶來巨大的價值。
- 通過利用大數據,製藥行業可以推動藥物開發過程每一步的改進,從藥物發現和確定新靶點到臨床試驗和監管審批,再到營銷和上市後監控。
- 在製藥行業採用大數據是一項充滿挑戰的企業,需要公司克服組織孤島、無縫集成不同的數據源並確保合規性。
三年前,製藥行業面臨著前所未有的挑戰。 現在,危機中吸取的教訓正在推動整個行業的變革。
新型冠狀病毒在全球迅速蔓延後不久,這場騷動就開始了。 製藥公司吸引了全球的關注,努力開發新的 COVID-19 疫苗,同時繼續向有需要的患者供應重要的醫療產品。
該行業出色地抵禦了危機。 但我們看到的是,製藥公司再也無力承擔被動的危機管理費用。 應該出現新的範式,幫助行業解決早就該解決的問題,即:
- 2022年新藥開發成本達22.84億美元
- 2022 年平均週期時間將增至 7.09 年
- 醫藥研發投資回報率下降至1.2%。
行業參與者可能會鎖定科學合作夥伴關係、投資新興市場並使其產品組合多樣化來應對這些問題。 然而,對於擁有十年提供大數據諮詢服務和製藥軟件解決方案經驗的技術愛好者,我們建議考慮另一種方式——基於數據的方式。
在這篇博文中,我們探討了大數據在製藥領域的潛力,並探討了大數據技術改變藥物開發、批准和營銷方式的基本方式。
什麼是製藥行業的大數據?它如何轉化為價值?
製藥行業產生大量信息。 臨床試驗數據、電子健康記錄、基因組信息、真實世界證據和患者報告的結果——所有這些數據條目組合起來可以稱為大數據。
從本質上講,大數據是任何格式和來源的大量且多樣化的信息,可以通過分析轉化為見解。
將大數據轉化為大洞察的標準流程如下:
這一切都始於收集相關數據。 它的類型和來源可能有很大差異。 製藥行業大數據的常見信息類型:
- 臨床試驗數據包含藥物評估過程中收集的信息。 它可能包括研究方案、參與者人口統計數據、病史、治療反應、不良事件、實驗室測試結果等。
- 真實世界的證據,包括在實際臨床實踐中受控臨床試驗環境之外收集的數據。 它可以涵蓋索賠、可穿戴設備和電子健康記錄的數據以及患者報告的結果。
- 涉及個體遺傳信息的基因組學和分子數據,包括 DNA 變異、基因表達譜和基因組生物標誌物,以及與藥物發現相關的分子的結構、相互作用和功能的信息。
- 電子健康記錄,包括患者的病史、過敏、診斷、實驗室結果和其他相關信息。
- 涵蓋 X 射線、MRI 和 CT 掃描的成像數據。
- 藥物警戒和不良事件報告,揭示與藥物相關的不良事件和安全問題。
- 涵蓋研究論文、會議記錄和專利的科學文獻。
- “組學數據”是指由所謂的“組學”學科生成的大規模數據集,例如基因組學、代謝組學、蛋白質組學、轉錄組學等。
在加載到數據倉庫之前(想想:所有製藥大數據的集中存儲),從多個來源檢索的信息會經過清理和轉換。 這是確保數據清晰、正確並轉換為統一格式的重要步驟。 然後,清理和整理的數據將存儲在數據倉庫中,以便輕鬆訪問並進行分析。
大數據在製藥行業的基本用例
藥物研發是一條漫長而充滿風險的道路。 很少有候選藥物能夠進入市場。 在進入臨床前測試的 5,000 種化合物中,平均只有 5 種能夠進行人體測試。 最初的 5,000 種藥物中只有一種獲得批准用於臨床。
好消息是,在藥物開發過程的每一步,製藥大數據都可以派上用場。
藥物發現
藥物研發和藥物發現的基礎階段始於研究人員在細胞或分子水平上了解疾病背後的過程。 確定潛在目標後,接下來的過程是尋找可以與目標相互作用並干擾其活性的化合物。
研究人員現階段面臨的主要挑戰包括確定有效且安全的靶標,以及尋找具有所需效力、選擇性和安全性的化合物。
通過利用製藥大數據,研究人員可以解決這些問題並提高藥物發現的速度和有效性。
目標識別和驗證
可以使用大數據集成來自不同來源的數據集。 通過分析這些多維數據集,研究人員可以更快地識別新靶點、藥物適應症和藥物反應生物標誌物,並降低風險。
最近創建並公開了許多用於臨床前藥物發現的參考製藥大數據集:
- dbSNP:多種生物體的單核苷酸多態性 (SNP),包括超過 1.5 億個人類參考 SNP。
- dbVar:基因組結構變異主要由已發表的各種生物體研究產生,包括超過 210 萬個人類 CNV。
- COSMIC:主要是來自專家管理和全基因組篩選的體細胞突變,包括超過 350 萬個編碼突變。
- 千人基因組計劃:大量人群的基因組,提供人類遺傳變異的綜合資源; 該數據集涵蓋 2,500 多個樣本。
- TCGA:包含 10,000 個樣本的 30 多種癌症的基因組學和功能基因組學數據存儲庫。 主要數據類型包括突變、拷貝數、mRNA 和蛋白質表達。
- GEO:NCBI 託管的功能基因組學數據存儲庫,包括超過 160 萬個樣本。
- ArrayExpress:由 EBI 託管的功能基因組學數據存儲庫,包括超過 180 萬個樣本。
- GTEx:正常組織的轉錄組圖譜,包括 45 種組織類型的 7,000 多個樣本。
- CCLE:1,000 多種癌細胞系的遺傳和藥理學特徵。
這些製藥大數據集被廣泛用於識別目標分子。
例如,在藥物發現中,基因表達是最廣泛使用的分子特徵之一,已用於指導靶標選擇。
一組研究人員利用公開的製藥大數據集來檢查 844 個乳腺癌樣本的 mRNA 表達,並將其與正常乳腺組織進行比較。 通過分析數據集中的大數據,他們發現癌症樣本中的 MTBP 基因顯著升高。 將研究結果與生存數據交叉引用還表明,MTBP 增加與患者生存率較差顯著相關。
在上面的例子中,目標是由研究人員提出的。 有了醫藥行業的大數據,通過分析公共大數據也可以直接發現目標。 通過這種方式,一組研究人員尋找了在乳腺癌中具有致癌性的可藥物激酶,但沒有考慮到特定的靶點。 他們分析了公共製藥大數據集的基因表達數據和乳腺腫瘤起始細胞的基因表達譜,發現了癌細胞系中 mRNA 表達較高的 13 種激酶。 隨後的驗證將候選激酶列表減少到八種激酶,其中三種被選為治療靶點。
預測建模
傳統上,研究人員使用植物或動物化合物來測試候選藥物。 2022 年 9 月,美國參議院通過了 FDA 現代化法案 2.0,允許使用動物測試的替代方案,包括計算機模型。
基於計算機模型的方法可以繞過與動物測試相關的不准確性和道德問題。 它還具有使該部門更接近人類生物活動的真實表現的潛力。
製藥中使用的預測建模技術之一是藥代動力學建模。 思考:利用製藥大數據、數學方程和計算機模擬來了解藥物在人體內的“行為”。 該方法有助於預測藥物服用後會發生什麼,包括藥物如何被吸收、分佈、代謝和消除。
另一種基於製藥大數據的有前景的技術是器官芯片技術。 器官芯片是利用微流控細胞結構模擬人體器官功能和生理環境的聚合物芯片,用於體外疾病建模、藥物測試和精準醫療。 我們 ITRex 幫助創建了一個芯片器官平台,該平台顯示了其在解決與動物測試相關的問題方面的有效性。 該平台已被 100 多個實驗室採用,有助於加速藥物開發並降低相關成本。
精準醫療
精準醫學可以定義為一種旨在在正確的時間為正確的人提供正確的治療的方法。 傳統上,針對大多數臨床問題,精準策略仍然是人們所渴望的。 如今,大數據在製藥領域的使用日益廣泛,有望實現這一理想目標。
基於大數據的藥物開發較少依賴於先驗知識,有可能揭示與疾病相關的意想不到的途徑,為更高程度的精確性和個性化鋪平道路。 一些機構已經在利用這種新穎的方法。
例如,具有相似癌症亞型的患者在接受相同的化療藥物時通常會有不同的反應。 據信藥物反應受到基因組不穩定性的影響。 使用大數據正在成為研究基因組學與化療耐藥性、毒性和敏感性之間複雜關係的流行方法。
例如,科學家可以通過癌症基因組圖譜研究網絡發起的泛癌症項目發現新的癌症畸變。 其他幾個項目,例如癌細胞系百科全書和癌症藥物敏感性基因組學,也在生成藥物大數據,以研究基因組生物標誌物與藥物敏感性之間的聯繫。
臨床試驗
臨床試驗的目的是判斷一種治療方法對人類是否安全有效。
通常,它分為三個連續階段,從第一階段開始,其中藥物在一小群健康個體上進行測試,到第二階段,其中藥物在顯示出目標特定病症的更大群體中進行測試,所有進入涉及更多患者的第三階段的方式。
這個過程一直是漫長而乏味的。 幸運的是,隨著大數據在製藥領域的廣泛採用,臨床試驗也在發生變化。
更快的招聘
全球十分之九的試驗無法在目標時間內招募到足夠的人員。 一些試驗——尤其是那些測試罕見或危及生命的疾病的治療方法的試驗——很難招募到足夠的受試者。 通常,臨床試驗涉及兩組:接受正在測試的新治療的測試組和不接受治療、安慰劑或當前標準治療的對照組。
請記住,患有危及生命的疾病的患者需要快速幫助,他們不想被隨機分配到對照組。 再加上需要招募病情相對罕見的患者,招募時間長達數月之久。
大數據可以幫助繞過完全僱用控制組的需要。 這個想法是使用基於過去試驗中生成的製藥大數據創建的“虛擬對照組”。
為了尋找可能的對照組候選者,研究人員使用研究試驗中的關鍵資格標準,例如疾病的主要特徵及其進展程度。 標準臨床試驗以類似的方式選擇對照患者。 不同之處在於,不依賴當前試驗期間收集的數據,而是使用過去的數據。 不過,就目前而言,虛擬對照組並不能取代傳統的臨床試驗,而是一種快速評估新療法是否值得採用的方法。
藥物臨床試驗中大數據的另一個方面是允許有針對性的招募。 借助新技術,研究人員可以根據新的數據來源(例如社交媒體)招募患者。 權衡遺傳信息、疾病狀況和個體特徵等標準變得更加容易。
高效的試驗管理
在製藥領域使用大數據可以改變臨床試驗的設計和管理方式。 現在,研究人員可以實時跟踪和檢測藥物暴露水平、藥物提供的免疫力、治療的耐受性和安全性,以及對新兵安全至關重要的其他因素,而不僅僅是在試驗完成後。
研究人員通過利用製藥大數據取得的成果包括:
- 最佳樣本量計算:分析歷史試驗數據可以幫助為樣本量計算提供信息。
- 分層和亞組分析:大數據可以幫助識別影響治療反應的患者特徵、生物標誌物或遺傳因素。 這可以幫助研究人員將患者分為亞組,以分析特定人群中的治療效果。
- 適應性試驗設計:分析製藥大數據可以促進適應性試驗設計,並讓研究人員根據中期結果更改試驗參數。 研究人員現在可以深入研究趨勢、治療反應或安全信號,以便就修改試驗參數(例如樣本量或入組標準)做出明智的決定。
質量控制和合規性
製藥領域的大數據正在徹底改變傳統的藥品質量控制方法,使製藥公司能夠實施更好的質量控制流程、簡化合規工作並提供更安全、更有效的藥品。 製藥大數據可以產生重大影響的領域包括:
#改善藥物警戒和不良反應監測
由於臨床試驗中樣本數量有限,許多不良反應,尤其是罕見的不良反應未被發現。 這就是為什麼即使在藥物釋放後也有必要對其進行監測的原因。
考慮到社交媒體已成為表達客戶擔憂和報告副作用的平台,製藥公司開始利用大數據工具來利用這些寶貴的信息。
從社交媒體收集的患者報告的藥物不良反應甚至可以比醫療專業人員記錄的更準確。 FDA 和 Epidemico 進行的一項研究檢查了 690 萬條推文,發現其中 4,401 條類似於不良事件報告。 進一步將研究結果與 FDA 持有的數據進行比較,發現非正式社交媒體報告與臨床試驗中記錄的報告之間存在高度相關性。
強化合規管理
製藥行業的大數據在促進監管合規方面發揮著重要作用。 製藥行業的公司受到復雜的法規網絡的約束,包括 GMP(良好生產規範)和 GCP(良好臨床規範)以及嚴格的數據隱私法。 藥品大數據可以幫助公司監控關鍵績效指標、識別合規差距並主動解決潛在問題。
製藥公司可以使用自動化監控系統和大數據分析解決方案及早檢測異常、偏差和不合規活動,從而最大限度地降低監管風險。 此外,通過結合歷史數據、機器學習算法和先進的統計技術,製藥公司可以開發預測模型來預測潛在的質量風險、優化預防性維護計劃並促進數據驅動的決策。
銷售和營銷
通過利用醫藥大數據,企業可以預測行業趨勢,並根據人口統計因素預測特定藥品的銷售情況。 這可以幫助根據客戶行為定製藥品營銷活動。
與上述用例類似,抓取互聯網上可用的數據(包括社交媒體數據)可以幫助製藥公司衡量客戶對其產品的情緒。 這可能有助於製藥公司了解他們的產品是如何被接收的。
在製藥行業採用大數據的挑戰
儘管大數據給製藥行業帶來了諸多好處,但企業仍然有意識地徹底改革其數據管理流程。 我們匯總了公司在製藥行業採用大數據時可能面臨的一系列挑戰,以降低您的實施過程的風險。
挑戰1. 整合數據源
將所有數據源緊密聯繫起來是製藥行業獲得大數據優勢需要克服的關鍵挑戰之一。 在製藥領域有效利用大數據需要整合藥物開發過程各個階段生成的數據,從發現到監管審批再到實際應用。
端到端數據集成需要許多功能:收集可信數據、連接這些來源、執行可靠的質量保證、管理工作流程等等。
一般來說,由於涉及風險和成本,我們建議避免一次性徹底檢修數據基礎設施。 更安全的方法是逐步集成您的數據源,首先確定需要處理的特定數據類型,並根據需要創建額外的倉儲功能。 目標是首先處理關鍵數據,以便盡快獲得投資回報。 同時,您可以開髮用於集成較低優先級的數據源的方案。
挑戰 2. 克服組織孤島
如果不克服組織內的孤島,端到端的數據集成幾乎是不可能的。 傳統上,在製藥行業,不同的團隊對其係統和數據負責。 轉向以數據為中心的方法,為跨職能孤島和數據管道的每種類型的數據提供明確的所有者,這將有助於提高製藥行業從大數據中產生價值的能力。
挑戰 3. 監管合規性
在製藥行業採用大數據並推出集中式數據管理系統,必須確保數據得到安全可靠的處理。 FDA 要求該部門使用的軟件(例如,用於處理電子健康記錄或管理臨床試驗的系統)滿足許多要求,包括訪問控製程序、用戶身份驗證、執行操作的跟踪等。 在規劃項目時,請務必仔細研究相關的合規性要求並將其納入數據管理解決方案的設計中。
挑戰4.缺乏處理大數據的人才
傳統上,製藥行業在技術採用方面進展緩慢,因此許多公司仍然缺乏實現其雄心勃勃的計劃所需的人才。 製藥行業參與者必須想出一種適當的方法來縮小知識差距——無論是培養內部人才還是求助於外部團隊。
而不是下結論
製藥業的大數據為創新、效率和改善患者治療結果提供了巨大的機會。 隨著製藥大數據市場的持續增長,企業正在採用這種變革性技術來保持競爭力。
如果您尋求釋放大數據的真正力量並推動藥物開發的突破,請聯繫我們的專家,我們將回答任何尚未解答的問題。
最初於 2023 年 6 月 22 日發佈於https://itrexgroup.com 。