KIB OpenIR  > 中国西南野生生物种质资源库
一种基于大规模基因树的物种树构建方法
赵磊; 李洪涛; 李德铢
2018-10-09
申请号CN201811173902.X
公开(公告)号CN109411021A
专利权人中国科学院昆明植物研究所
公开日期2019-03-01
摘要本发明提供一种批量搜索大规模单或者低拷贝直系同源基因簇(orthologous gene clusters),并利用大规模基因树(gene trees)构建物种树(species trees)的方法。该方法综合运用了基于HMM的搜索直系同源基因的HAMSTR程序,基于多序列比对分析MAFFT程序和自动提取精确比对区域的TRIMAL程序,以及构建物种树RAxML,ASTRAL‑II和MP‑EST程序,并结合Perl脚本语言编程等方法实现整个数据流过程。实验证明,本发明所提供的批量搜索大规模单或者低拷贝直系同源基因簇,并利用大规模基因树构建物种树的方法与系统,精确度高,速度快,实现了批量化、自动化。
其他摘要1.批量搜索大规模单或者低拷贝直系同源基因簇,并利用大规模基因树构建物种树的方法,其特征在于该方法包括如下步骤:收集或者测序每个物种转录组或者基因组数据,这些数据一般包括CDS和蛋白质序列,命名分别为XXX_pep.fa,XXX_cds.fa;接着,用HaMStR搜索单或者低拷贝直系同源基因簇,运行命令和相关参数为:perl./hamstrsearch_local‑hmmer3.v8.pl‑sequence_file=XXX_pep.fa‑protein‑taxon=XXX‑hmmset=magnoliophyta_hmmer3‑representative‑relaxed‑eval_limit=0.01‑blast_NOCPU=8–rbh,从而已完成每个物种的直系同源基因的搜索;为形成相应直系同源基因簇,便于大规模的多序列比对,用Perl程序sub_print_orthology_HASH.pl把相应的基因合并成直系同源基因簇;用Perl程序mafft_alignment_orthology_shell.pl把多序列比对程序MAFF集成在相应的Perl脚本中,方便进行大规模的多序列比对;用Perl程序trimal_alignment_orthology_shell.pl删除多序列比对的结果中排列不好的区域;用Perl程序Find_RAxML_tree_CDS_Protein_MPEST_shell.pl把建树程序RAxML集成在Perl脚本中,方便进行大规模的单基因树构建;最后,用Perl程序Generate_MPEST_GeneTress_shell.pl和Generate_ASTRAL_GeneTress_shell.pl生成MPEST和ASTRAL‑II要求的基因树输入格式,完成基于单基因树构建物种树。
文献类型专利
条目标识符http://ir.kib.ac.cn/handle/151853/67759
专题中国西南野生生物种质资源库
作者单位中国科学院昆明植物研究所
第一作者单位中国科学院昆明植物研究所
推荐引用方式
GB/T 7714
赵磊,李洪涛,李德铢. 一种基于大规模基因树的物种树构建方法[P]. 2018-10-09.
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
[赵磊]的文章
[李洪涛]的文章
[李德铢]的文章
百度学术
百度学术中相似的文章
[赵磊]的文章
[李洪涛]的文章
[李德铢]的文章
必应学术
必应学术中相似的文章
[赵磊]的文章
[李洪涛]的文章
[李德铢]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。