| 一种基于二代测序的植物叶绿体全基因组组装成环方法 |
| 赵磊; 李洪涛 ; 李德铢
|
| 2018-10-09
|
申请号 | CN201811174710.0
|
公开(公告)号 | CN109411014A
|
专利权人 | 中国科学院昆明植物研究所
|
公开日期 | 2019-03-01
|
摘要 | 本发明是基于二代测序数据(如:Illumina平台)对植物叶绿体全基因组数据进行组装并构建成环的一种方法。本发明所提供的方法首先运用了数据过滤软件Trimmomatic、组装软件SPAdes和MASHMAP软件,然后利用ChloroplastCircle工具包,并结合Perl脚本语言编程实现整个植物叶绿体全基因组组装、成环的数据流过程。通过大量实验证明,本发明所提供的方法能够快速的、准确的、批量的、自动的完成植物叶绿体全基因组的组装和成环。目前,本发明在10,000个植物叶绿体全基因组项目中已经实施,取得了良好的效果。 |
其他摘要 | 1.一种基于二代测序的植物叶绿体全基因组组装成环方法,其特征在于该方法包括如下步骤:用二代测序Illumina平台对总DNA(包括核DNA,叶绿体DNA和线粒体DNA)样品进行测序,每个样品测序2G;用数据过滤软件Trimmomatic对原始数据进行处理,除去接头和低质量的reads,得到clean reads;用SPAdes对clean reads进行多个kmer从头组装,构建Scaffolds;用拟南芥叶绿体基因组中的4Kb序列作为库,然后用组装后的Scaffolds序列作为query,做BLASTN操作;用ChloroplastCircle工具包中的parse_blastnToScaffold.pl脚本解析BLASTN结果,得到bitscore最大分值的那条Scaffolds序列;用最大分值的Scaffolds序列再次BLAST一些完整的叶绿体基因组库,这些叶绿体基因组序列可从NCBI上下载,或用户自己提供;用ChloroplastCircle工具包中的parse_blastnToReference_Genome.pl脚本进行解析,得到与目标Scaffolds最近缘的某个物种的叶绿体全基因组参考序列;用MASHMAP软件把组装后的所有Scaffolds序列向叶绿体参考基因组序列上mapping,在参考基因组上定位;最后利用ChloroplastCircle工具包中的parse_MashMap.pl脚本对mapping到参考基因组的Scaffolds进行连接、并且用没有mapping上的Scaffolds进行补洞,最终成环,达到NCBI数据库的上传标准。 |
文献类型 | 专利
|
条目标识符 | http://ir.kib.ac.cn/handle/151853/67760
|
专题 | 中国西南野生生物种质资源库
|
作者单位 | 中国科学院昆明植物研究所
|
第一作者单位 | 中国科学院昆明植物研究所
|
推荐引用方式 GB/T 7714 |
赵磊,李洪涛,李德铢. 一种基于二代测序的植物叶绿体全基因组组装成环方法[P]. 2018-10-09.
|
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论