40
6.2 应有的后续研究,以及广泛应用方向的展望 41
致谢 42
参考文献 44
1 绪论
1.1 课题研究背景
从1990年启动人类基因组计划到1999年首次成功地完成人体染色体基因完整序列的测定,再到2003年成功绘制人类基因组图,经过13年时间解读自身的“生命之书”,可以说在基因序列分析的技术上有了一定的基础。阐明不同生物基因组DNA序列信息及破译相关遗传学背景的基因组学已经成为生物学和医学研究的核心学科。重要的人类病原菌、植物病原菌和腐生菌等微生物基因组序列的测定,不仅推动繁殖方式的选择、顶端生长、致病机制和宿主,真菌相互作用等基础研究,还能更好地寻找抗菌药物靶点,促进疫苗和抗菌药物的开发研制。相信随着迅速发展的高通量方法应用于微生物基因组学研究,将会大大地推动此领域的研究进程。
微生物基因组相关网站上,关于基因组研究和序列分析的成果可以通过文本挖掘方法获得,如网络爬虫(蜘蛛)技术。网络爬虫的起源是从搜索引擎开始的,90年代当时人们先用手工后用蜘蛛程序搜索网页,但随着互联网的不断壮大,怎样能够搜集到的网页数量更多、时间更短成为了当时的难点和重点,成为人们研究的重点,网络爬虫又称为电脑“机器人”,是指某个能以人类无法达到的速度不间断地执行某项任务的软件程序,专门用于检索信息的“机器人”程序就象蜘蛛一样在网络间爬来爬去,反反复复,不知疲倦。
另一方面,近几年来,NoSQL运动发展势头相当好,它应用范围非常广泛的,是一类持久化解决方案,不遵循关系数据库模型,也不使用SQL作为查询语言。其中NoSQL的典型代表——图形数据库,是把整个数据集建模成一个大型的稠密的网络结构,目前,neo4j是世界领先的图形数据库,它基于java实现,在neo4j中,数据结构不是必须的,甚至可以完全没有,它将数据以点和边的形式表示出来,这可以简化模式变更和延迟数据迁移。源:自~751-·论`文'网·www.751com.cn/
本课题将两者结合起来,利用neo4j图数据库处理微生物基因组序列的相关信息。
1.2 研究意义
通过探讨微生物基因组的测序方法,能掌握微生物基因组的研究现状,展望微生物基因组的发展前景。自然界中,微生物可以称得上是“无处不在”,涵盖了众多种类,微生物基因组测序,在医学方面,可应用于“致病相关基因的鉴定”、“设计实验诊断方法”、“疫苗的研究”、“开发新型抗生素”等,新兴的生物技术研究应用,也是和微生物密不可分的,如基于微生物基因组研究的“生物降解作用”、“酶工业”、“食品生物技术”、“抗生物质”等,在基因组测序的基础上进行序列分析,生成系统生成树,对研究微生物进化,能提供有效参考。在地球生物中,微生物所占量达到60%以上,它们在地球上生存和进化了近37亿年,能够在任何极端环境(高温、低温、强碱、强酸、高盐、高压、黑暗等)条件下生存,以往的研究依赖于实验室培养,但是绝大多数微生物实验室培养困难,所以到目前为止,大概仅有1%的微生物种类被人类认识到,其中相当大一部分都没有被重视被重点研究,因为微生物对环境的适应范围之广以及丰富的多样性,可以推测到它们蕴藏着解决令我们百思不得其解问题的潜力。 cypher图数据库在微生物群落基因关系网络构建中的应用研究(2):http://www.751com.cn/jisuanji/lunwen_71752.html