卷鞘鸢尾参考转录组的组装方法评估及应用
朱张士昌
导师段元文
关键词非模式生物,转录组测序,种质资源,鸢尾属,群体遗传 Non-Model Organism,RNA-Seq,Germplasm Resource,Iris,Population Genetics
摘要非模式生物具有更高的多样性,但缺乏组学数据阻碍了对其多样性形成机制的深入研究。第二代转录组测序数据能为大量非模式生物提供组学资源,已有转录组从头组装评价方法在指标选取上不够全面且缺少整合,缺乏组装个体数评价,且评价类群主要为模式生物,无法充分指导从头组装。本论文以非模式生物卷鞘鸢尾(Iris potaninii)为对象,共测序了12个种群76个个体的转录组数据,评价了转录组从头组装软件和个体数的组装效果,确定了该物种的最优组装参数。基于最优参数组装了参考转录组,开展群体转录组分析,探讨了青藏高原地区卷鞘鸢尾的群体遗传多样性。主要结果与结论如下: 1. 参考转录组组装方法评估 本论文从卷鞘鸢尾10个种群中随机挑选了10个个体的转录组数据,全面选取了17项组装质量指标(涵盖碱基、reads、contigs至转录组层面)与2项计算资源消耗指标(最大内存占用与运行时间),基于(0,1)归一化方法整合指标并构建评价体系,评价了rnaSPAdes、Trinity、Trans-ABySS、SOAPdenovo-Trans与Bridger等软件。结果表明,rnaSPAdes是卷鞘鸢尾的最优组装软件,其组装质量明显优于其余软件,且运行耗时较短。此外,基于参考基因组覆盖度评价了不同个体数的组装效果。结果表明,组装质量与计算资源消耗均随个体数增加而增加。当个体数达到30时,组装质量随个体数的增长开始放缓,且内存等计算资源消耗即将超出限制。最终确定卷鞘鸢尾的最优组装个体数为30。以上结果表明,应优先考虑组装质量,而计算资源可能是组装最优个体数的限制因素。 2. 参考转录组及其应用 基于组装方法评价部分的最优转录组,从基因差异表达划分的4类个体中随机挑选了30个个体进行参考转录组组装。利用转录组数据,共获得了143,317条序列(unigene)与752,870个高质量SNP。卷鞘鸢尾种内遗传多样性较低(π = 1.739e-3),种群间遗传分化较低(FST = 0.101),种内变异主要集中于个体间(分子方差分析,占物种总变异的86.830%),种群遗传与地理距离无显著相关性(Mantel检验)。Stairway plot分析表明,该物种从1Mya至今的3次主要瓶颈事件分别对应希夏邦马冰期、古乡冰期与新冰期。所有个体分为4组(遗传结构、ML树与主成分分析),但4组缺乏明显的地理结构。在所有种群中,青海果洛的种群(I12)具有较高遗传多样性(π = 1.767e-3, Ho = 0.088, He = 0.077),包含4个组所有的遗传成分,并与I4、I5、I13与I14等种群存在历史基因流(Nm、ABBA-BABA检验与treemix分析)。综合以上结果,较为合理的解释是种群I12是卷鞘鸢尾在青藏高原的冰期避难所。冰期时种群收缩导致了种群间的基因交流,而伴随冰期-间冰期循环发生了多次种群迁移,两者促进该种形成了如今的遗传多样性格局。此外,环境关联分析(bayenv与lfmm)与基因功能注释(GO与KEGG)的结果表明,25个SNP及其所在基因(共23个)具有响应环境压力与DNA修复等功能,可能体现了对强紫外线、极端低温与干旱等高原恶劣环境的适应性。 综上所述,本论文构建了较为通用的转录组组装评价体系,有助于指导从头组装高质量非模式生物转录组。此外,利用最优的组装结果,揭示了卷鞘鸢尾的遗传多样性与遗传结构,为种质资源进一步开发利用提供了依据。
语种中文
2022-05
学位授予单位中国科学院大学
文献类型学位论文
条目标识符http://ir.kib.ac.cn/handle/151853/75189
专题昆明植物所硕博研究生毕业学位论文
推荐引用方式
GB/T 7714
朱张士昌. 卷鞘鸢尾参考转录组的组装方法评估及应用[D]. 中国科学院大学,2022.
条目包含的文件
文件名称/大小 文献类型 版本类型 开放类型 使用许可
朱张士昌-朱张士昌-毕业论文-提交系统版(17595KB)学位论文 限制开放CC BY-NC-SA请求全文
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[朱张士昌]的文章
百度学术
百度学术中相似的文章
[朱张士昌]的文章
必应学术
必应学术中相似的文章
[朱张士昌]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。