摘要:利用人的细胞系为研究对象,整合多种生物信息学、统计学方法,探讨在基因组水平上miRNAs表达量和转录活性之间的相关性。本试验利用miRNAs序列与已知基因序列的位置重叠关系,分析了41组人类细胞系的microRNA-seq和mRNA-seq数据集文件、10组microRNA-seq和ChIP-seq数据集文件,这些细胞系涵盖了人类永生细胞系、原代细胞系、干细胞系、诱导多能干细胞系、体外分化型细胞系。结果表明,利用pri-miRNAs信息分析得出miRNAs表达量和转录活性存在显著相关性的结果,相关系数为0.1-0.4;但利用成熟miRNAs信息分析得到miRNAs表达量和转录不存在相关性的结果。基于目前和已公布的数据,我们得出miRNAs表达量和转录活性之间存在一定相关性的结论。27417
毕业论文关键词:miRNAs表达;人类细胞系;转录;相关性分析
Using human cell lines as model to analyze the correlation between miRNAs expression and transcription
Abstract:This work focused on human cell lines and examined the correlation between differential miRNA expression and transcriptional activity at a genome-wide scale by using a variety of bioinformatics and statistical methods. According to the overlaps of miRNAs-coding sequences and annotated genes, we analyzed 41 pairs of microRNA-seq and mRNA-seq dataset files, 10 pairs of microRNA-seq and ChIP-seq dataset files of human cell lines, which covered human immortalized cell lines, primary cell lines, stem cell lines, induced pluripotent stem cell lines and in vitro differentiated cell lines. Results showed that miRNA expression positively correlates with transcription in many human cell lines according to experimental pri-miRNA information, with correlation coefficient between 0.1 and 0.4. On the other hand, miRNA expression has no correlation with transcription in many human cell lines with only mature miRNA information. We concluded that there is a modest correlation between miRNA expression and transcriptional activity based on existing, public data.
Key words: miRNAs expression; human cell lines; transcription; correlation analysis
目 录
摘要1
关键词1
Abstract1
Key words1
引言1
1资料与方法3
1.1材料实验数据的下载、分析平台3
1.1.1数据下载网页平台3
1.1.2数据分析平台及软件3
1.2实验方法3
1.2.1查找基因组数据集3
1.2.2查找人类各细胞系对应的miRNA-seq、mRNA-seq和ChIP-seq的数据集3
1.2.3对所下载的数据进行整理分析3
2结果与分析4
2.1数据汇总4
2.2数据相关性分析4
2.2.1利用Pri-miRNAs信息,分析miRNA-seq和mRNA-seq的相关性4
2.2.2利用成熟miRNAs信息,分析miRNA-seq和mRNA-seq的相关性5
2.2.3利用Pri-miRNAs信息,分析miRNA-seq和ChIP-seq的相关性6
2.2.4利用成熟miRNAs信息,分析miRNA-seq和ChIP-seq的相关性6
2.2.5利用总数据结果分析miRNAs表达量和转录的相关性7
3讨论7
致谢8
参考文献9
附录1 数据集编号汇总10
附录2 数据统计结果汇总11
以人的细胞系为模型分析miRNAs表达量与转录的相关性
microRNAs(miRNAs)是一大家族长度为22个核苷酸(nucleotide, nt)左右、在多细胞生物中广泛表达的非编码RNAs[1,2]。miRNAs主要通过结合靶基因mRNA位于3’非编码区的互补序列而降低靶基因的蛋白质翻译水平和/或mRNA表达水平[1,3]。miRNAs调控各种各样的生理过程;miRNAs表达量的高低、变化可以反映生物个体、组织、细胞的表型,此信息还可能用于人类疾病(如癌症)的诊断、预后及治疗[2,4-6]。
典型(canonical)动物miRNAs的形成要经过转录及一系列特异性的RNA加工和RNA:蛋白相互作用[7,8],如图1所示。miRNAs基因通常由RNA聚合酶II(PolII)转录,最初产物为pri-miRNAs (primary miRNAs),和pre-mRNAs相似。细胞核内的Drosha/DGCR8全酶识别并切割pri-miRNAs上特定的发卡结构,产生约60 nt 的pre-miRNAs (precursor miRNAs)。转运蛋白Exp5把pre-miRNAs送到细胞质中。然后,RNA酶Dicer切割pre-miRNAs,产生约22 nt的miRNAs双链中间物。此双链RNA与Argonaute (Ago)蛋白作用,最终其中一条单链RNA,作为成熟的miRNAs,与Ago蛋白稳定结合。这一miRNAs:Ago复合体即是抑制基因表达的最小功能单位。据miRBase的统计整理,动物基因组有成百上千个miRNAs基因[9]。虽然相当数量的这些基因是否表达真正的miRNAs仍然存疑,但确知的是,一个Drosha蛋白(同理,PolII、 Exp5、 Dicer和Ago)直接作用于数以百计不同的miRNA底物。 以人的细胞系为模型分析miRNAs表达量与转录的相关性:http://www.751com.cn/shengwu/lunwen_21893.html