創(chuàng)藥新聲

News

予路乾行再登JCIM,用AI大模型生成小分子3D構(gòu)象!

予路乾行聯(lián)合武漢理工大學(xué)頂尖研究團(tuán)隊(duì)的研究成果《DihedralsDiff: A Diffusion Conformation Generation Model That Unifies Local and Global Molecular Structures》已于2025年5月在線發(fā)表于《Journal of Chemical Information and Modeling》。該研究由鄭錚教授團(tuán)隊(duì)開發(fā)了一種小分子3D構(gòu)象生成模型DihedralsDiff,能高效地預(yù)測(cè)生成分子構(gòu)象,解決了傳統(tǒng)方法在分子構(gòu)象測(cè)量中的局限性。

予路乾行再登JCIM,用AI大模型生成小分子3D構(gòu)象!

以下三組視頻展示了基于 DihedralsDiff 生成分子構(gòu)象的過程。該過程需要輸入分子的 SMILES 字符串或能夠明確表示原子類型、鍵連接關(guān)系及鍵類型的結(jié)構(gòu)信息。基于此,首先模型會(huì)隨機(jī)生成標(biāo)準(zhǔn)高斯分布的隨機(jī)原子坐標(biāo),得到分子的初始高斯噪聲構(gòu)象。隨后,DihedralsEncode 模塊將分子構(gòu)象映射為二面角噪聲子圖集合。通過一個(gè)指定時(shí)間步長(zhǎng)(500 個(gè)時(shí)間步長(zhǎng))的馬爾可夫鏈進(jìn)行逐步去噪,每一步都會(huì)得到對(duì)應(yīng)時(shí)間步長(zhǎng)下的分子噪聲構(gòu)象,最終恢復(fù)至原始分子構(gòu)象。

咖啡因(Caffeine),其分子骨架包含典型的嘌呤雙環(huán)結(jié)構(gòu)。選取該分子的真實(shí)構(gòu)象作為參考,利用 DihedralsDiff 模型生成分子構(gòu)象,旨在驗(yàn)證模型對(duì)環(huán)狀結(jié)構(gòu)的生成能力。如視頻所示,模型能夠從高斯噪聲構(gòu)象出發(fā),實(shí)現(xiàn)了咖啡因分子雙環(huán)體系(苯環(huán)與嘧啶環(huán))三維幾何特征的高精度重構(gòu)。

賴諾普利(Lisinopril)是一種二肽類降壓藥物,其分子包含一個(gè) L-脯氨酸基團(tuán) 和一個(gè) L-賴氨酸殘基。選取該分子的真實(shí)晶體構(gòu)象作為參考,利用 DihedralsDiff 模型生成分子構(gòu)象,旨在驗(yàn)證模型對(duì)柔性肽鏈結(jié)構(gòu)與手性中心保持能力的生成精度。如視頻所示,模型生成的分子構(gòu)象在肽鏈結(jié)構(gòu)完整性與手性中心保持率方面均展現(xiàn)出優(yōu)異的穩(wěn)定性,充分證明其對(duì)類藥分子具有卓越的構(gòu)象生成能力。

胸腺五肽(Thymopentin)是一種具有免疫調(diào)節(jié)功能的多肽,其氨基酸序列為 H-Arg-Lys-Asp-Val-Tyr-OH。基于 DihedralsDiff 模型在咖啡因(剛性環(huán)系)、賴諾普利(柔性二肽)等小分子構(gòu)象生成中已驗(yàn)證的性能,本研究進(jìn)一步將其拓展至中等長(zhǎng)度肽鏈體系,以胸腺五肽為參考對(duì)象評(píng)估模型對(duì)復(fù)雜肽鏈的構(gòu)象建模能力。如視頻演示:模型生成的分子構(gòu)象與參考結(jié)構(gòu)高度逼近,且活性位點(diǎn)的三維構(gòu)型保持完整。該結(jié)果驗(yàn)證了DihedralsDiff模型雖未在多肽數(shù)據(jù)集上訓(xùn)練,仍能有效生成中等長(zhǎng)度肽鏈的穩(wěn)定構(gòu)象。

研究亮點(diǎn)1:?

分子的局部結(jié)構(gòu)與總體構(gòu)象協(xié)同建模

DihedralsDiff模型通過DihedralsEncode模塊將分子圖G映射為二面角子圖集合D,并由DihedralsEncode模塊計(jì)算出所有子圖的二面角角度,并將與子圖中原有的原子特征,鍵的特征結(jié)合形成子圖特有的原子特征,鍵的特征和二面角特征,每個(gè)子圖作為獨(dú)立的單元輸入到后續(xù)模型中。同時(shí)所有二面角子圖共享原子的三維坐標(biāo),這使得模型在考慮子圖局部結(jié)構(gòu)時(shí)同時(shí)也顧全到分子的整體結(jié)構(gòu),從而顯著提升了學(xué)習(xí)效率和生成精度。

予路乾行再登JCIM,用AI大模型生成小分子3D構(gòu)象!

研究亮點(diǎn)2:?

結(jié)合擴(kuò)散模型來完成分子構(gòu)象生成

DihedralsDiff模型結(jié)合去噪概率模型(DDPM)完成訓(xùn)練和采樣。訓(xùn)練階段,模型隨機(jī)采樣時(shí)間步長(zhǎng),根據(jù)該時(shí)間步長(zhǎng)對(duì)二面角子圖集合的原子三維坐標(biāo)進(jìn)行加噪,得到加噪后的噪聲二面角子圖集合,然后輸入神經(jīng)網(wǎng)絡(luò)中得到原子的噪聲得分,以此去逼近對(duì)原子三維坐標(biāo)加噪量,從而達(dá)到訓(xùn)練優(yōu)化模型的目的。在采樣階段,模型從分子的標(biāo)準(zhǔn)高斯分布出發(fā),由DihedralsEncode模塊得到二面角子圖噪聲集合。噪聲子圖原子特征,鍵的特征和二面角特征輸入神經(jīng)網(wǎng)絡(luò)獲取當(dāng)前時(shí)間步的原子噪聲得分,經(jīng)去噪操作生成下一時(shí)間步的二面角子圖噪聲集合。通過多步迭代去噪操作,最終恢復(fù)分子的初始三維構(gòu)象,該過程嚴(yán)格遵循馬爾可夫鏈的逐步去噪機(jī)制。

予路乾行再登JCIM,用AI大模型生成小分子3D構(gòu)象!

予路乾行再登JCIM,用AI大模型生成小分子3D構(gòu)象!

原文鏈接:

https://pubs.acs.org/doi/full/10.1021/acs.jcim.5c00367



關(guān)于予路乾行



蘇州予路乾行生物科技有限公司(Divamics Inc.)打造了獨(dú)特的多尺度分子動(dòng)力學(xué)模擬平臺(tái)與創(chuàng)新藥早研決策AI平臺(tái),旨在更精準(zhǔn)理解藥物分子與靶點(diǎn)的動(dòng)態(tài)相互作用和作用機(jī)制,理性設(shè)計(jì)藥物,預(yù)測(cè)藥效和成藥性,突破傳統(tǒng)藥物發(fā)現(xiàn)瓶頸,為小分子、多肽、大分子等多種類型的藥物研發(fā)提供Hits-to-PCC一體化研發(fā)平臺(tái)。?

公司獲評(píng)蘇州市工業(yè)園區(qū)科技領(lǐng)軍項(xiàng)目、蘇州市級(jí)姑蘇領(lǐng)軍人才項(xiàng)目、國(guó)家高新技術(shù)企業(yè),核心技術(shù)獲得諾貝爾化學(xué)獎(jiǎng)得主Roald Hoffmann教授推薦。公司總部位于蘇州,在北京設(shè)有計(jì)算中心,在新加坡、日本設(shè)有BD合作中心,目前已與超50家國(guó)內(nèi)外生物醫(yī)藥企業(yè)合作推進(jìn)70余條新藥研發(fā)管線。