南加州大學(xué)(USC)的研究人員在Nature子刊《自然方法》(Nature Methods)上發(fā)表了題為“Geometric deep learning of protein–DNA binding specificity”的文章。該研究開(kāi)發(fā)了一種新型的AI模型,該模型能夠準確預測不同類(lèi)型的蛋白質(zhì)如何與DNA結合。
論文截圖
這個(gè)模型被稱(chēng)為“深度結合特異性預測器”(Deep PBS),它是一種幾何深度學(xué)習模型,旨在通過(guò)蛋白質(zhì)–DNA復合物的結構來(lái)預測蛋白質(zhì)–DNA的結合特異性。借助Deep PBS,科學(xué)家和研究人員可以將蛋白質(zhì)–DNA復合物的數據結構輸入到一個(gè)在線(xiàn)計算工具中。
“蛋白質(zhì)–DNA復合物的結構通常包含與單一DNA序列結合的蛋白質(zhì)。為了理解基因調控,獲取蛋白質(zhì)對任何DNA序列或基因組區域的結合特異性至關(guān)重要,”南加州大學(xué)多恩西夫文理學(xué)院定量與計算生物學(xué)系教授兼創(chuàng )始系主任雷莫·羅赫斯(Remo Rohs)說(shuō)。“Deep PBS是一種AI模型,它可以通過(guò)取代高通量測序或結構生物學(xué)實(shí)驗來(lái)揭示蛋白質(zhì)–DNA的結合特異性。”
圖1:Deep PBS的框架示意圖
AI分析、預測蛋白質(zhì)–DNA結構
Deep PBS采用了幾何深度學(xué)習模型,是一種利用幾何結構來(lái)分析數據的機器學(xué)習方法。該模型旨在通過(guò)捕捉蛋白質(zhì)–DNA的化學(xué)特性和幾何背景,來(lái)預測其結合特異性。
Deep PBS基于這些數據生成空間圖,以展示蛋白質(zhì)結構與DNA之間的關(guān)系。與許多現有方法不同的是,Deep PBS還可以預測不同蛋白質(zhì)家族的結合特異性。
“對于研究人員來(lái)說(shuō),能擁有一種適用于預測不同蛋白質(zhì)的通用方法非常重要。這種方法還使我們能夠設計新的蛋白質(zhì),”羅赫斯說(shuō)道。
圖2:Deep PBS 在預測實(shí)驗確定的結構的蛋白質(zhì)家族之間的結合特異性方面的性能
蛋白質(zhì)結構預測的重大進(jìn)展
自Deep Mind推出Alpha Fold以來(lái),蛋白質(zhì)結構預測領(lǐng)域迎來(lái)了快速進(jìn)展。Alpha Fold能夠根據序列來(lái)預測蛋白質(zhì)結構。這些工具為科學(xué)家和研究人員提供了大量可供分析的結構數據。Deep PBS與結構預測方法相結合,可以在沒(méi)有可用實(shí)驗結構的情況下預測蛋白質(zhì)的特異性。
羅赫斯表示,Deep PBS的應用前景廣闊,這種研究方法可能會(huì )為生命科學(xué)研究領(lǐng)域的方案設計提供新思路,并可能在合成生物學(xué)和RNA研究中帶來(lái)新的突破。
雜志:Nature Methods
DOI:10.1038/s41592-024-02372-w