发布时间:2020-12-14 09:57:58 点击数:次
近年来lncRNA的研究越来越多,当我们高通量测序筛选到很多的差异表达lncRNA的时候,在挑选lncRNA时也可以从保守性的角度来考虑,保守性分析用处很广,多物种保守性强的lncRNA有可能发挥重要的功能。如果想预测lncRNA的保守性,我们可以通过一些数据库来查询。
1、NONCODE数据库
NONCODE是一款综合性的数据库,该数据库目前收录了39个物种,包括16种动物和23种植物,即黑猩猩、人、小鼠、大鼠、奶牛、鸡、果蝇、斑马鱼、秀丽隐杆线虫、酵母、拟南芥、水稻等物种。该数据库包含信息丰富,不仅提供lncRNA的基本信息如染色体位置、正负链、外显子数量、长度和序列,而且还提供表达谱、保守性信息、预测功能和疾病关系等,并可进行序列Blast搜索,同时支持数据下载,是一个非常实用的数据库。
如果要查询某个已知的lncRNA,进入NONCODE数据库,输入想要查询的lncRNA的名称,例如KCNQ5-IT1,点击Search后就会出现下图的页面,在这个页面内可以看到转录本ID和这个转录本的基因ID以及在基因组上的位置信息等,如下图:
点击转录本的基因ID,进入页面后除了有这个lncRNA的保守性信息之外,还有此基因包含的lncRNA的转录本信息、lncRNA在各组织中的表达情况以及与疾病相关的信息,如下图:
在保守性分析模块可得到保守性分析树,我们查询的这个lncRNA的保守性信息如下图: 如果其在某一个物种中有保守的lncRNA信息,那么会加粗显示,如上图展示。如果查询结果里没有发现保守性相关信息,出现这种情况不一定就说明其在其它的物种上没有保守性序列,有可能是NONCODE数据库信息不全面,我们可以考虑换其他的方法查询。 2、LNCipedia数据库 LNCipedia是一个综合性的人类lncRNA数据库,该数据库整合了LncRNAdb、Ensembl和Gencode等多个数据库信息。在这个数据库中我们不仅可以查询lncRNA保守性,还可以查询lncRNA基因ID、转录本ID和染色体位置等基本信息以及不同软件预测的蛋白编码潜能的结果。 该数据库通过lncRNA临近的蛋白编码基因在不同物种间的保守性来分析lncRNA的保守性,如果某个lncRNA的参照蛋白编码基因在其它物种间有同源,则认为该lncRNA在其它物种里也应该存在。打开网址进入数据库后,输入想要查询的lncRNA,例如KCNQ5-IT1,点击查询最后出现如下页面: 对于lncRNA的跨物种研究,如果想要找到相同基因在不同的物种上,比较简单方法是在NCBI中直接搜索,看你想研究的某个lncRNA是否在这两个物种中都存在,也可以利用UCSC数据库来查询或者使用其他序列比对软件blast一下看看究竟有多少同源序列。