发布时间:2021-04-02 13:51:24 点击数:次
· 发表期刊: Molecular Plant
· 影响因子:12.084
· 发表时间: 2021年1月
研究背景
植物不同细胞类型具有独特的生物学功能,取决于它们能利用相同基因组信息,产生特定细胞类型的转录组表达谱;通常由于不同细胞和细胞类型的染色质可及性差异,转录组表达谱存在差异。scRNA-seq技术已应用于拟南芥根原生质体,可以准确描述数千种细胞的转录组表达谱及其在突变体中或对胁迫反应的应答差异。然而利用植物原生质体来分析基因表达存在一些问题,比如某些细胞类型对细胞壁消化有抗性,原生质体制备过程对基因表达也有很大影响,对较小细胞/原生质体的测序存在偏差等等。因此,为解决植物原生质体分离和实验操作的困难,作者通过分离大量细胞核建立了植物单细胞的转录组数据库;并且已有许多动物单核转录组研究报道,与单细胞相比,细胞核也可建立具有生物学意义的转录组信息。本文先验证了植物单核转录组和原生质体转录组结果的高度相关性,为深入了解拟南芥根细胞和细胞亚群间的基因表达调控机制,作者首次开发应用单核ATAC-seq技术(sNucATAC-seq)研究特定细胞类型的染色质可及性,以及细胞分化和发育过程中染色质可及性的动态变化,然后整合单核RNA-seq(sNucRNA-seq)和单核ATAC-seq(sNucATAC-seq)数据来共同揭示染色质可及性对拟南芥根基因表达的影响。
研究结果
1.拟南芥根单核转录组数据具有生物学意义
提取拟南芥幼苗根的细胞核,使用10X Genomics Chromium平台进行sNucRNA-seq文库构建。为了比较sNucRNA-seq和scRNA-seq转录组数据,对分离出的10548个拟南芥根细胞核进行转录组测序,平均每个单核检测到1124个基因,共检测到24510个蛋白编码基因;而已发表的7437个拟南芥原生质体的单细胞转录组结果,共检测到25177个表达基因,平均每个单细胞检测到4739个基因。为了验证sNucRNA-seq数据的生物学意义,对拟南芥根组织RNA-seq,原生质体RNA-seq和细胞核RNA-seq数据进行相关性分析,发现拟南芥根的单核sNucRNA-seq转录组与原生质体scRNA-seq转录组结果高度相关。
利用Seurat软件包,将10548个拟南芥根核与7437个拟南芥根原生质体转录组数据进行整合(图1 A),进行UMAP聚类分析,分别分为21, 20个不同细胞簇(图1 B)。UMAP结果表明20个共同cluster之间存在重叠。其中,cluster 4和cluster 11超过89%由拟南芥根核组成(图1 C),而cluster14 则全部由根核组成(图1)。
拟南芥27 420个蛋白编码基因,发现sNucRNA-seq和scRNA-seq两种技术共同检测到60.4%基因;相反,sNucRNA-seq和scRNA-seq技术有26.3%的基因均未检测到;sNucRNA-seq或scRNA-seq结果中单独表达的基因分别占6%,7.3%;除cluster14外,sNucRNA-seq技术检测到的每个cluster的基因百分比(52.7%-73.3%),与scRNA-seq技术检测到的每个cluster的基因百分比(58.4%-75.2%)没有显著差别(图1C)。以上结果表明,拟南芥单细胞和核转录组能够提供相似的信息,表明分离出的植物细胞核可用于单细胞水平上建立有意义的转录组信息;另外鉴定3个新的细胞亚群表明,与scRNA-seq相比,sNucRNA-seq方法可捕获到更具多样性和代表性的拟南芥根细胞类型。
图1 拟南芥单细胞和单核转录组的UMAP聚类分析
2. 拟南芥根细胞簇的功能注释
根据已报道的101种拟南芥细胞类型的marker基因,将21个拟南芥细胞簇分为六大类细胞亚群:trichoblasts (clusters 1–3), atrichoblasts(clusters 4–7), meristematic cells (clusters 8–10), cortical cells (clusters 11–12), endodermal cells (clusters 13–16)和stele cells (clusters 17–21)(图2 A)。此外,基于marker基因的表达模式,可以确定韧皮部和木质部细胞簇(图2 A)。UMAP拓扑结构图显示了不同细胞类型的细胞和细胞核的功能组织(图2 A),例如,根分生细胞(clusters 8-10)位于UMAP图的中心,从这些分生细胞开始,经过几个细长的细胞亚群(3、6、7、12和13),以球状细胞亚群(1、2、5、11、15和18)结束。这些细长的细胞亚群可能反映细胞分化过程中转录组发生的渐进性变化,而球形细胞亚群代表了拟南芥根的分化细胞。
通过sNucRNA-seq技术鉴定的3个细胞亚群4,11,和14(图2 A),其中14可被分成2个不同细胞亚群:内胚层(cluster 14a)和皮质(cluster 14b)(AT1G61590,AT2G40160,AT2G48130和AT4G17215为内胚层marker基因;AT5G18840和AT3G21670 为皮质marker基因)。Cluster 14a还可以通过过氧化物酶(AT1G68850,AT2G35380)和 GDSL-motif酯酶/酰基转移酶/脂肪酶(AT2G23540和AT5G37690)的编码基因作为特征;GDSL基因家族成员控制细胞分化过程,如大米WDL1和番茄GDSL1基因,表明cluster14a可能由分化细胞组成。UPBEAT1基因(AT2G47270)是过氧化物酶基因的转录活性和活性氧分布的主要抑制因子,并且通过细胞增殖与分化之间的平衡来调节拟南芥根顶端分生组织的大小。GDSL脂肪酶在角质生物合成过程中也起着重要作用。Cluster 14a中还有许多基因参与了木栓质和角质的生物合成。综上表明cluster 14a的细胞是分化的内胚层细胞。
Cluster 14b的特征是皮质细胞marker基因(AT5G18840和AT3G21670 )特异性表达。基因SCRAMBLED / STRUBBELIG(SCM,AT1G11130)对根表皮细胞形态起着至关重要作用,且SCRAMBLED / STRUBBELIG特异表达由Cluster14b中参与脂质代谢的基因(AT1G45201 [ TLL1;三酰基甘油脂酶];AT5G63560 [HXXXD型酰基转移酶])调控。综上,皮质细胞亚群cluster 14b在拟南芥表皮根细胞的分化和形态起重要作用(图2 A)。
Cluster 4的特征是CEP1(AT5G50260)和EXI1(AT2G14095)特异性表达,这两个基因先前被定义为根冠细胞死亡程序的调节器。此外,KIRA1(AT4g28530),一种控制花发育过程中细胞死亡的基因,在Cluster 4中特殊表达。还发现大多数细胞死亡marker基因(BFN1,RNS3,SCPL48,DMP4和PASPA3)也在Cluster4和木质部Cluster21中表达(图2A)。
图2 拟南芥根细胞类型的功能注释
3. 单细胞分辨率ATAC-seq揭示了染色质可及性对基因表达的影响
为了更好地评估染色质可及性对植物基细胞和细胞亚群基因表达的影响,作者通过10X Genomics sNucATAC-seq技术对分离的4764个拟南芥根核进行测序,结果共鉴定到20803个染色质可及性结合位点,进行不同细胞类型的差异peak以及marker基因的功能注释分析,结合比较不同细胞亚群的结合位点以及基因的表达数据,揭示了染色质可及性对基因表达的影响(图3)。
图3 sNucATAC-seq用于表征拟南芥根细胞类型之间染色质可及性差异
4. ATAC-seq揭示的单细胞分辨率的染色质可及性可用作分子标记,指示根毛和内胚层细胞发育状态
根据marker基因表达谱注释植物单细胞类型。基因表达与染色质可及性之间的相关分析表明后者也可用作构成拟南芥根的细胞类型的另一种分子标记。为了验证这一假设,利用单细胞分辨率ATAC-seq数据,并将分析重点放在代表成熟拟南芥根毛和内胚层细胞的三个和四个簇上(即簇1、2和3,分别为群集13、14、15和16;图4)。
为了验证差异化染色质可及性作为植物细胞身份分子标记的用途,首先寻找了在三个和四个根毛和内胚层细胞簇中优先鉴定的sNucATAC-seq峰。在与注释的拟南芥基因的TSS配对的11858个sNucATAC-seq峰中,在根毛和内胚层簇中分别鉴定出20个和26个。挖掘scRNA-seq和sNucRNA-seq数据集,确定了拟南芥中优先表达的19个(95%)和25个基因(96.2%)分别是根毛和内胚层细胞(图5)。通过确定簇1、2和3以及簇13、14、15和16特定的可利用染色质的峰来分析,从而鉴定了相关的根毛和内胚层marker基因。除了支持染色质可及性在控制植物细胞中基因表达中的作用外,强调了染色质可及性可用作注释特定细胞类型的分子标记。
图4 336个标记基因的基因表达与染色质可及性(x轴)和基因表达(y轴)之间的相关性分析
图5 46个拟南芥 基因(x轴)的标准化表达水平, 其特征在于在根毛(左)和内胚层(右)簇中,TSS位置染色质的可及性更高
研究结论
与其它复杂生物体一样,植物由不同的特殊细胞类型组成。细胞类型特异转录过程是这些不同细胞类型独特功能的基础。本文报道了拟南芥根组织中单细胞核RNA测序(sNucRNA-seq)和单核ATAC测序(sNucATAC-seq)。通过与已发表的原生质体转录组比较,验证了本文单细胞核转录组测序中利用细胞核进行植物细胞类型特异性转录组建立的可靠性。此外,sNucRNA-seq的结果揭示了之前单细胞RNA-seq并未鉴定到的新细胞类型。与sNucRNA-seq结果类似,sNucATAC-seq结果将拟南芥的细胞核分布到不同的簇中,这表明染色质在不同的细胞亚群之间根据其细胞类型的不同,染色质可及性明显不同。为了揭示染色质可及性对基因转录的影响,作者整合了sNucRNA-seq和sNucATAC-seq数据,发现特定细胞类型的marker基因表现出特殊的染色质可及性。因此在细胞亚群水平上染色质可及性的差异是调控基因表达的关键因素。
原文链接:https://www.sciencedirect.com/science/article/pii/S1674205221000010