人類(lèi)基因組包含約23,000個(gè)基因,但在任何特定時(shí)刻,只有少部分基因在細胞內被激活??刂苹虮磉_的復雜調控元素網(wǎng)絡(luò )中,包括一類(lèi)稱(chēng)為增強子的基因組區域,這些區域通常位于它們調控的基因的遠處。
這種距離使得映射基因與增強子之間的復雜互動(dòng)變得困難。為了克服這一難題,麻省理工學(xué)院(MIT)的研究人員發(fā)明了一種新技術(shù),該技術(shù)使他們能夠觀(guān)察細胞中基因和增強子激活的時(shí)序。當一個(gè)基因與特定增強子幾乎同時(shí)被激活時(shí),這強烈暗示該增強子正在控制該基因。
了解哪些增強子在不同類(lèi)型的細胞中控制哪些基因,可以幫助研究人員確定遺傳疾病的潛在藥物靶點(diǎn)?;蚪M研究已經(jīng)在許多非蛋白質(zhì)編碼區域發(fā)現與多種疾病相關(guān)的突變。這些區域是未知的增強子嗎?
“當人們開(kāi)始利用遺傳技術(shù)識別帶有疾病信息的染色體區域時(shí),大多數這些位點(diǎn)并不對應基因。我們推測它們可能與這些增強子有關(guān),這些增強子可能與啟動(dòng)子相隔很遠,因此,能夠識別這些增強子極為重要。”麻省理工學(xué)院終身榮譽(yù)教授、Koch綜合癌癥研究所成員Phillip Sharp如是說(shuō)。
Sharp是這項即將發(fā)表在《自然》雜志的新研究的資深作者,MIT研究助理D.B. Jay Mahat是論文的主要作者。
尋找增強子RNA(eRNA)
人類(lèi)基因組中不到2%的部分由蛋白質(zhì)編碼基因構成?;蚪M的其余部分包括許多控制這些基因何時(shí)以及如何表達的元素。增強子,一種約45年前被發(fā)現的通過(guò)與基因啟動(dòng)子區域物理接觸并短暫形成復合體從而激活基因的元素,最近在2010年被發(fā)現能被轉錄成RNA分子,稱(chēng)為增強子RNA(eRNA)??茖W(xué)家推測,當增強子與其目標基因積極互動(dòng)時(shí),會(huì )發(fā)生這種轉錄。這種發(fā)現提供了一種可能性,即通過(guò)測量eRNA的轉錄水平可以幫助研究人員確定增強子何時(shí)活躍及其目標基因。
Mahat指出:“這些信息對于理解發(fā)展過(guò)程以及理解癌癥如何改變其調控程序并激活導致細胞退化和轉移性增長(cháng)的過(guò)程至關(guān)重要。”
圖1:?jiǎn)渭毎律鶵NA測序的原理圖和基準。
然而,因為eRNA的產(chǎn)量很小并且在細胞中不穩定,這種映射被證明是具有挑戰性的。此外,eRNA缺乏一種稱(chēng)為poly-A尾的修飾,這是大多數技術(shù)用來(lái)從細胞中提取RNA的“鉤子”。
在尋求捕獲eRNA的新方法過(guò)程中,Mahat和Sharp考慮使用點(diǎn)擊化學(xué),這是一種可以用來(lái)將兩個(gè)分子連接起來(lái)的技術(shù),前提是它們各自帶有可以相互反應的“點(diǎn)擊把手”。
圖2:利用scGRO-seq推斷轉錄動(dòng)力學(xué)。
研究人員設計了帶有一個(gè)點(diǎn)擊把手的標記核苷酸,一旦這些核苷酸被嵌入正在生長(cháng)的eRNA鏈中,就可以用含有互補把手的標簽來(lái)提取這些鏈。這使得研究人員能夠捕獲eRNA并進(jìn)行純化、擴增和序列化。盡管在每個(gè)步驟中都會(huì )丟失一些RNA,但Mahat估計他們可以成功地從給定細胞中提取大約10%的eRNA。
使用這項技術(shù),研究人員獲得了細胞中正在積極轉錄的增強子和基因的快照。
“你希望能夠在每一個(gè)細胞中確定來(lái)自調控元素及其對應基因的轉錄激活情況。這必須在單個(gè)細胞中完成,因為這是你可以檢測到調控元素和基因之間的同步或不同步的地方。”Mahat說(shuō)。
基因表達的時(shí)序
在小鼠胚胎干細胞中展示他們的技術(shù)時(shí),研究人員發(fā)現他們可以根據RNA鏈的長(cháng)度和聚合酶(負責轉錄的酶)的速度——即聚合酶每秒轉錄的距離,大致計算出特定區域開(kāi)始轉錄的時(shí)間。這使他們能夠確定哪些基因和增強子大致在同一時(shí)間被轉錄。
圖3:通過(guò)非多聚腺苷化的復制依賴(lài)性組蛋白基因表達的細胞周期推斷。
研究人員使用這種方法詳細確定了細胞周期基因表達的時(shí)序。他們還能確認幾組已知的基因-增強子對,并生成了約50,000對可能的增強子-基因對,現在他們可以嘗試驗證這些對。
學(xué)習哪些增強子控制哪些基因對于開(kāi)發(fā)具有遺傳基礎的疾病的新治療方法具有價(jià)值。去年,美國食品藥品監督管理局批準了用于治療鐮狀細胞貧血的第一種基因治療方法,該方法通過(guò)干擾一個(gè)導致激活胎兒珠蛋白基因的增強子,從而減少鐮狀血細胞的產(chǎn)生。
圖4:基因和增強子之間的空間和時(shí)間協(xié)調。
MIT團隊目前正在將這種方法應用于其他類(lèi)型的細胞,重點(diǎn)研究自身免疫疾病。他們正在與波士頓兒童醫院的研究人員合作,探索與狼瘡相關(guān)的免疫細胞突變,許多突變發(fā)生在基因組的非編碼區域。
“目前還不清楚這些突變影響哪些基因,所以我們開(kāi)始解析這些假定增強子可能調控的基因,以及這些增強子在哪些細胞類(lèi)型中活躍。”Mahat說(shuō)。 “這是創(chuàng )建基因與增強子圖譜的工具,這些圖譜在理解生物學(xué)和疾病的基礎上具有基礎意義。”
這項研究的發(fā)現還為Sharp最近與MIT教授Richard Young和Arup Chakraborty共同發(fā)展的一種理論提供了證據,即基因轉錄是由稱(chēng)為凝聚體的無(wú)膜滴控制的。這些凝聚體由大量的酶和RNA組成,Sharp認為其中可能包括在增強子位點(diǎn)產(chǎn)生的eRNA。
“我們認為,增強子與啟動(dòng)子之間的通信是一種凝聚體類(lèi)型的瞬態(tài)結構,RNA是其中的一部分。這項工作是構建增強子來(lái)源的RNAs可能活躍的理解的重要組成部分。”
雜志:Nature
DOI:10.1038/s41586-024-07517-7