最近,《Nature》發(fā)布重磅成果,基因本體聯(lián)盟(Gene Ontology Consortium)聯(lián)合全球150余位科學(xué)家,推出全新資源PAN-GO功能組上線(xiàn)了,它整合了人類(lèi)基因及其他生物遺傳數據,為超過(guò)20,000個(gè)基因提供已知功能的全面百科。
基因本體是一個(gè)由國家衛生研究院資助的知識庫,已持續擴展和改進(jìn)超過(guò)25年,成為生物研究過(guò)程中的重要基礎。每年已有超過(guò)30,000篇出版物使用該資源,輔助數據分析和解讀。
開(kāi)展“組學(xué)”實(shí)驗的生物研究人員會(huì )生成能夠識別數百個(gè)重要基因的數據。審閱數千篇關(guān)于每個(gè)基因已知功能的研究論文并不切實(shí)際,因此許多科學(xué)家轉向基因本體作為工具。
南加州大學(xué)凱克醫學(xué)院生物信息學(xué)部門(mén)主任、公共與人口健康科學(xué)教授、也是基因本體聯(lián)盟首席研究員的Paul D. Thomas博士表示:“我們的知識庫使科學(xué)家能夠從一長(cháng)串基因列表中,理解它們的生物學(xué)功能,有時(shí)甚至能夠指向潛在的研究方向。”
這一最新進(jìn)展為知識庫增添了一個(gè)新資源,利用進(jìn)化建模提升了工具的功能。該方法使研究人員能夠將從人類(lèi)基因收集的實(shí)驗數據與從模式生物(如小鼠和斑馬魚(yú))獲得的相關(guān)基因數據結合起來(lái)。這樣可以提供更全面的人類(lèi)基因功能圖景,填補人類(lèi)研究中直接證據缺乏的科學(xué)空白。
Thomas博士表示:“我們先前積累了豐富的知識庫,成為了人類(lèi)基因功能的重要參考。而現在,通過(guò)補充每個(gè)功能在進(jìn)化中出現的時(shí)間,我們提供了更全面、準確和簡(jiǎn)潔的功能描述。”
進(jìn)化論點(diǎn)
自1998年以來(lái),研究團隊細致審查了超過(guò)175,000篇關(guān)于基因功能的科學(xué)論文,搜尋著(zhù)名生物體以及人類(lèi)基因組中每個(gè)基因已知功能的數據。
在審查文獻后,他們根據每個(gè)基因所執行的生物功能進(jìn)行分類(lèi),分為獨立作用或與其他基因聯(lián)合作用的功能。他們從自己開(kāi)發(fā)的一個(gè)包含超過(guò)40,000種功能的目錄中進(jìn)行選擇,這些功能涵蓋細胞分裂、細胞信號傳遞、免疫反應、分子運輸等多個(gè)方面。理解基因組組合所執行的確切功能可以幫助研究人員了解在各種條件下出現的問(wèn)題,并設計相應的研究方案。
PAN-GO功能組將在科學(xué)界以相同的方式使用——用于分析組學(xué)數據等應用——但將提供更精確的結果,Thomas強調。這是因為此次工作整合了知識庫中的所有信息,采用大規模的進(jìn)化模型(跟蹤成千上萬(wàn)個(gè)基因和相關(guān)蛋白質(zhì)的進(jìn)化歷史),提供了更完整和準確的基因功能圖景。
在許多情況下,來(lái)自人類(lèi)基因的實(shí)驗數據可能并不可得,但科學(xué)家們對小鼠、老鼠、斑馬魚(yú)、果蠅、酵母或大腸桿菌中的相關(guān)基因進(jìn)行了研究。通過(guò)了解特定功能(如能量處理或細胞信號傳遞)何時(shí)以及如何進(jìn)化,研究人員可以利用其他生物體的數據推測人類(lèi)基因的功能。
Thomas博士表示:“這幫助我們推測人類(lèi)基因的功能特征,即使對于該人類(lèi)基因本身沒(méi)有直接證據。”
進(jìn)一步完善知識庫
展望未來(lái),基因本體聯(lián)盟呼吁研究人員在分析中廣泛使用PAN-GO功能組。該信息以機器可讀格式結構化,允許科學(xué)家使用計算工具(如人工智能)快速搜索和使用數據。
聯(lián)盟也發(fā)出號召:研究人員現在可以通過(guò)項目網(wǎng)站提交更新知識庫中特定基因的建議。通過(guò)眾包的方式獲取基因功能的知識,并以結構化的方式對其進(jìn)行分類(lèi),確保這一共享資源能夠隨著(zhù)時(shí)間不斷改進(jìn),且其見(jiàn)解更易于應用。
盡管PAN-GO功能組是關(guān)于基因功能最全面的資源,但目前仍不完全。它包含了82%的編碼蛋白質(zhì)基因的數據,但仍有18%(約3,600個(gè)基因)的實(shí)驗數據未獲得,其生物功能仍然未知。
Thomas博士表示:“我們現在真實(shí)地看到了缺失信息的部分,這也為未來(lái)在該領(lǐng)域的研究指明了方向。”
雜志:Nature
DOI:10.1038/s41586-025-08592-0