“與其把電力用在挖掘比特幣上,不如把電力用來挖掘人類的‘知識顆粒’。”中國科學院計算技術研究所—哲源·圖靈達爾文實驗室主任牛鋼語出驚人,人類已發表了三、四千萬篇生命科學領域的專業論文,利用算法、程序和高強算力,人類能夠對一個疾病進行深度的挖掘。
挖掘“知識顆粒”,與挖比特幣相似的是都以算法、程序進行高強運算,形成一個個單元,不同的是,前者形成新藥研發的知識單元,后者形成金融支付單元。
近日,這個與寒武紀同根同源,孵化自中科院計算所高性能計算機研究中心的團隊,經重慶市經信委牽線與當地上市藥企華森結成戰略合作,將“知識顆粒”的挖掘應用于創新藥的研發實踐之中。
人工智能必不可少
不是所有的數據挖掘都是人工智能,走進人工智能時代需要顛覆性的創新實踐。
寒武紀發布了全球首個搭載人工神經網絡的芯片,哲源團隊發揮了同樣的優勢,在新藥創制系統中,“神經元”的訓練成為一大亮點。
“瞄準新藥創制,我們能夠提供極大知識的驅動。”牛鋼解釋,之所以是“極大知識”,因為基于強大的算力,團隊目前已實現可及論文、知識載體的全部挖掘。
數據的“密集恐懼癥”在算力充足、算法優化的基礎上,已不成問題。中科院計算所高性能中心主任譚光明表示,這是面向生命科學的第五范式的主要平臺,應首先向藥物研發行業釋放技術價值。
例如,針對免疫系統疾病,團隊將全面抓取文獻,以不同研究方向形成“知識顆粒”,值得一提的是,這些顆粒是“活性顆粒”。“‘知識顆粒’將變成一個神經元。”牛鋼解釋,訓練神經元的是現實世界中藥物、基因、患者之間形成的大量事實,至此,新藥創制系統中的“神經元”不僅學會了理論也經歷了實踐。
人工智能的特性決定了每個神經元不是孤立的。
團隊已完成上萬個神經元的訓練。在此基礎上,活性神經元之間的“關系網”自發形成,目前已經產出了400多個細胞內確定性事件基礎模型,甚至可以組合出不同的腫瘤進化情況。
疾病有了“數字孿生”,創新藥成本將大幅下降
“我們計劃訓練上百萬個與疾病相關的神經元,神經元之間的聯系也將對現實進行映射。”牛鋼表示,當神經元覆蓋到人體的全系統,人體內的發病過程將得到數字化的“再造”。
當疾病有了“數字孿生”,那么新藥創制將擁有高度仿真的“演習基地”。
當下,各大制藥企業也都開啟了引入人工智能的手段來提升藥物的篩選效率。有統計顯示,一款藥物從化合物到完成臨床前研發已經從2—3年縮短到兩個月。
“但現有人工智能的發力點多集中在少數幾個腫瘤的致病基因。”牛鋼認為,如果只基于腫瘤1%的信息篩選藥物,那么很難提高成功率。
“數字孿生”意味著,人類有能力通過超強算力對腫瘤中突變的全部基因進行考量,而不是“抓重點”。
“算力不足時,放棄全面抓重點是沒辦法的事,而一旦有了人工智能的手段,加上超強算力,AI能夠在新藥創制時面面俱到。”中科院計算所-哲源·圖靈達爾文實驗室副主任、哲源科技COO趙宇認為,這也是提高新藥創制成功率的關鍵。而提高成功率正是大大節約研發成本。
團隊的目標是建立全新藥物數字試驗場,將新藥創制的研發時間減半、投入減半,成功率提高一倍,到了臨床以后有效率提高一倍。
“人類有25000個功能基因,理論上說,對它們的系列研究是可以‘窮舉’的。”牛鋼表示,在可預見的未來,可以實現將25000個基因的神經元全部建立起來,進行對藥物、病癥的數字孿生和全息篩選。(記者 張佳星)
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
上一篇:最美“星月童話”點亮仲夏之夜