當前位置:首頁  院系

基礎(chǔ)醫(yī)學院郭國驥課題組《Dev Cell》發(fā)布高通量、低成本、高信噪比CH-ATAC-seq技術(shù)并繪制跨物種單細胞染色質(zhì)可及性圖譜

發(fā)布時間:2024-02-27來源:基礎(chǔ)醫(yī)學系作者:138

  多細胞生物中不同細胞類型共享相同的基因組,但由于基因的差異調(diào)控而形成高度特化的細胞功能。候選順式調(diào)控元件 (cCREs) 包括啟動子、增強子和絕緣子,通過提供轉(zhuǎn)錄因子(TFs)的結(jié)合位點,在基因調(diào)控中起關(guān)鍵作用。通過解讀TFs及其相應cCREs在物種間的保守基因組調(diào)控模式,可以深入了解細胞類型演化。盡管已有工作通過單細胞轉(zhuǎn)錄組測序(single cell RNA-seq,scRNA-seq)識別了多個物種的細胞特異TFs,但低表達水平的TFs的檢測仍受技術(shù)和成本限制,并且限制了TF調(diào)控網(wǎng)絡(luò)的探索。單細胞染色質(zhì)可及性測序 (single cell ATAC-seqscATAC-seq)可以提供與轉(zhuǎn)錄組互補的表觀調(diào)控信息,有助于我們更為深刻地理解跨物種的保守調(diào)控機制。人、小鼠的全身多組織染色質(zhì)可及性景觀已經(jīng)相繼問世,但其它模式生物如斑馬魚、果蠅和蚯蚓仍缺乏全身染色質(zhì)可及性景觀。

  202428日,浙江大學基礎(chǔ)醫(yī)學院/良渚實驗室郭國驥教授團隊在Development Cell上在線發(fā)表了題為Construction of Single-Cell Cross-Species Chromatin Accessibility Landscapes with combinatorial-hybridization-based ATAC-seq的研究論文,開發(fā)了一種基于組合雜交的高通量、低成本、高信噪比的單細胞染色質(zhì)可及性測序技術(shù)CH-ATAC-seq,構(gòu)建了低等物種包括斑馬魚,果蠅,蚯蚓的全身染色質(zhì)可及性景觀,并闡述了跨物種基因和調(diào)控元件的保守和多樣性特征。

CH-ATAC-seq是一種基于組合雜交的單細胞染色質(zhì)可及性技術(shù)。首先,細胞核在496孔板內(nèi)經(jīng)過轉(zhuǎn)座反應打上第一輪共384種標簽。然后,細胞核被收集混勻并均勻分布到新的96孔板進行雜交反應,并引入第二輪共768種標簽。最后,細胞核再次收集并分布到96孔板進行PCR反應,引入最后一輪共384種標簽。理論上,單次實驗可以處理百萬級別的細胞核,并且多個樣本可以進行通過第一輪標簽進行標記后混到一起處理,大大減少了樣本間的批次效應(圖1)。本研究生成了基于CH-ATAC-seq平臺的小鼠數(shù)據(jù),并與已發(fā)表的sci-ATAC-seq的小鼠腎臟數(shù)據(jù)進行比較,結(jié)果發(fā)現(xiàn)CH-ATAC-seq具有明顯更高的轉(zhuǎn)錄起始位點(TSS)富集分數(shù),表明CH-ATAC-seq數(shù)據(jù)具有更高的信噪比。

CH-ATAC-seq實驗原理流程

基于CH-ATAC-seq測序平臺,本研究構(gòu)建了成年斑馬魚、果蠅、蚯蚓的全身染色質(zhì)可及性景觀,總共得到~550000高質(zhì)量細胞核。為了驗證細胞類型注釋的準確性,利用相同物種的scRNA-seq數(shù)據(jù)進行標簽轉(zhuǎn)移。最后,分別對每個物種的差異peak富集,利用HOMER工具進行了motif的從頭富集。結(jié)果顯示,富集到的motif能較好地對應細胞類型特異功能。

為了系統(tǒng)性地進行跨物種細胞類型的比較分析,本研究收集了已發(fā)表的人、猴和小鼠的單細胞染色質(zhì)可及性景觀數(shù)據(jù),并進行了上游的數(shù)據(jù)統(tǒng)一處理,最終得到了152種主要細胞類型以及約80萬個細胞類型特異的cCREs。隨后,以人的基因組為參考,基于liftOver工具,將小鼠和斑馬魚的peak進行分類,包括:序列水平上無法與人基因組的區(qū)域?qū)R的UA元件;可以對齊到人基因但并非在兩個物種都開放的A元件;以及既序列保守又在兩個物種中同時開放的CA元件。CA元件被認為是序列和功能同時物種間保守的調(diào)控元件,具有顯著更高的Phylop保守分數(shù),并且這些元件高度富集在TSS區(qū)域。表明啟動子序列在細胞類型的進化中具有更高的選擇壓力,從而保留細胞類型特異的功能。 

隨后,基于SAMap算法,本研究對6個物種的染色質(zhì)可及性圖譜進行了跨物種分析,結(jié)果表明神經(jīng)和肌肉細胞展示了物種間高度保守性。另外,在細胞譜系水平上通過分析跨物種保守的TFs,發(fā)現(xiàn)上皮細胞顯示出了明顯的組織特異性。

最后,結(jié)合6個物種的單細胞轉(zhuǎn)錄組數(shù)據(jù),作者利用SENIC+進行了調(diào)控網(wǎng)絡(luò)的重構(gòu),鑒定出了譜系特異TF以及對應的TF靶向區(qū)域和TF靶向基因。與TF靶向區(qū)域相比,TF靶向基因具有相對高的保守程度。值得一提的是,雖然不同物種的TF靶向基因保守程度不高,但它們都能富集到細胞類型特異的功能。

總的來說,本研究開發(fā)了新一代的染色質(zhì)可及性技術(shù)——CH-ATAC-seq,并通過在物種層面上首次構(gòu)建跨物種染色質(zhì)可及性分析,深入了對細胞類型的保守性和多樣性的理解(圖2)。此外,本研究為遺傳學和進化生物學提供了寶貴數(shù)據(jù)資源和研究途徑。

分析流程圖

浙江大學基礎(chǔ)醫(yī)學院博士生張國棟、博士生傅雨婷、博士生楊蕾、博士后葉昉和博士后張霈婧為本文共同第一作者。浙江大學基礎(chǔ)醫(yī)學院/良渚實驗室郭國驥教授、良渚實驗室王晶晶研究員、浙江大學基礎(chǔ)醫(yī)學院韓曉平教授為本文的通訊作者。本研究獲得了國家重點研發(fā)計劃、國家自然科學基金、國家創(chuàng)新團體計劃的支持。