基于Illumina测序数据的豆科系统发育基因组学研究
张荣
导师伊廷双
学位专业植物学
关键词豆科 Illumina测序 叶绿体和线粒体基因组 系统发育 系统发育冲突
摘要豆科约有765属,超过19,500种,是被子植物物种多样性第三大科。此外,它也是经济上和生态上最重要的被子植物科之一。尽管过去20年的分子系统学研究取得很大进展,特别是豆科系统发育研究组(Legume phylogeny working group, LPWG)于2017年提出了六个亚科的新分类系统,但由于使用分子数据数量有限和/或分类单元代表样品采样不足,豆科植物的系统发育框架仍有很多节点尚未厘清。系统发育基因组学已经广泛应用于解析被子植物生命之树中困难的系统发育关系。但是,随着系统发育基因组分析中数据量的增加,可能导致系统误差显著增加,从而产生强支持但不正确的拓扑结构,故减少系统误差是系统发育基因组学中重要的课题。随着Illumina测序技术的快速发展和测序费用的逐步下降,Illumina基因组浅层测序已成为获取系统发育基因组学数据的主要手段。总DNA基因组浅层测序为获取多种类型分子材料的完整或近完整的叶绿体基因组,以及大部分线粒体基因甚至完整的线粒体基因组提供了可能。本论文以两种濒危植物雅砻江冬麻豆(Salweenia bouffordiana)和降香黄檀(Dalbergia odorifera)的叶绿体基因组及药用植物栗豆树(Castanospermum australe)的线粒体基因组为例,探讨了利用Illumina测序数据组装出完整叶绿体/线粒体基因组的途径,并简要介绍3个物种叶绿体或线粒体基因组的性状。同时,通过Illumina测序数据组装的叶绿体基因组数据,我们解析了豆科各分支的系统发育关系,分析系统发育重建中冲突的系统发育信号和探索系统发育冲突的原因。主要研究结果如下:1. 利用Illumina总DNA基因组浅层测序数据可以高效组装叶绿体基因组和少量线粒体基因组。雅砻江冬麻豆和降香黄檀完整的叶绿体基因组的长度分别为153,730 bp和156,064 bp,都包括1个LSC区、1个SSC区和2个IR区,有111个编码基因,包括77个蛋白质编码基因,30个tRNA基因和4个rRNA基因。它们的GC含量分别为36.8%和36.1%。它们的这些特性与大多数被子植物相似。两个濒危植物的叶绿体基因组为它们的遗传多样性研究及物种保育提供了遗传基础。基于基因组浅层测序,我们组装了栗豆树完整的线粒体基因组,并通过read mapping确认其存在两种同分异构体。对跨过重复序列的read pair进行定量评估,判断了主环(MC1)和次环(MC2)构型。MC1和MC2之间除了有一个64 Kb的倒位外,其它的部分都相同。栗豆树线粒体基因组的长度为542,079 bp,有37个蛋白质编码基因,18个tRNA基因和3个rRNA基因。尽管栗豆树与蝶形花亚科其它9个线粒体基因组有相似的基因和内含子含量,共享一些共线性区块和RNA编辑位点,但它们基因组大小和结构的高度变异表明蝶形花亚科线粒体基因组经历了剧烈的重组,提高了我们对蝶形花亚科线粒体基因组结构的认识。同时,系统发育重建表明线粒体基因可以在解析蝶形花亚科深度系统发育关系方面发挥重要作用。后续研究应利用更加高效的方法对豆科线粒体基因组进行测序和组装,更深入理解线粒体基因组的进化,并挖掘有用的系统发育信息。2. 豆科叶绿体系统发育基因组学研究解析了大多数深度分支的系统发育关系并获得高支持。该研究中,我们取样187种,其中151个是新测序的物种,并获得了完整或近完整的叶绿体基因组。我们的取样代表了豆科36个族中的35个及族下大多数的主要分支,以及豆目其它3个科的5属8个种作为外类群。我们使用移除矩阵中比对不好的区域、排除替代饱和的片段和筛选单基因树中具有高平均bootstrap值的片段等多个处理数据集的策略减少系统误差,大多数分析产生了一致的拓扑结构并获得了高支持率,解析了一些豆科长期有争议的深度系统发育关系,特别是Caesalpinoideae和Papilionoideae主要分支系统发育关系。如在Caesalpinioideae中,Umtiza grade的两个分支,((Arcoa, (Acrocarpus, Ceratonia))和(Umtiza, (Gleditsia, Gymnocladus))被解析为该亚科其它类群的连续姐妹群;Dimorphandra group + Tachigali clade + Peltophorum clade + Mimosoid clade分支得到稳定的高支持。在Papilionoideae内,我们的研究强支持Swartzioid clade,ADA clade和Cladrastis clade依次作为50 Kb inversion clade的连续姐妹群。除此之外,其它亚科下的分支关系也得到了很好的解析。例如在Detarioideae下,两个分支(Schotieae, (Barnebydendreae, Detarieae))和(Saraceae, (Afzelieae, Ameherstieae))的姐妹群关系得到强支持。在Cercidoideae中,Cercis和Adenolobus作为第一和第二分化的支系得到强支持。虽然本研究解析了豆科一些长期未解析的困难节点,但在几个节点上,如豆科的基部、Griffonia的位置、Pterogyne的位置,我们检测到了冲突的系统发育信号,这些冲突信号阻碍了利用叶绿体基因组数据对这些节点进行可靠的解析。本研究重建了具高支持率的豆科系统发育框架,为今后该科的分类、进化和多样化研究奠定了基础,并首次对叶绿体基因组中相互冲突的系统发育信号进行量化,同时也证明了在叶绿体系统发育基因组中剖析系统发育冲突的重要性。
2019-06
学位授予单位中国科学院昆明植物研究所
学位名称博士
文献类型学位论文
条目标识符http://ir.kib.ac.cn/handle/151853/73981
专题昆明植物所硕博研究生毕业学位论文
推荐引用方式
GB/T 7714
张荣. 基于Illumina测序数据的豆科系统发育基因组学研究[D]. 中国科学院昆明植物研究所,2019.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
张荣博士毕业论文-2019.pdf(7597KB)学位论文 限制开放CC BY-NC-ND请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[张荣]的文章
百度学术
百度学术中相似的文章
[张荣]的文章
必应学术
必应学术中相似的文章
[张荣]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。