从NCBI轻松下载和存储taxID基因组

genome_collector的Python项目详细描述


Travis CI build statushttps://coveralls.io/repos/github/Edinburgh-Genome-Foundry/genome_collector/badge.svg?branch=master

genomecollector是一个Python库,用于下载和管理参考基因组 特定类群的数据,特别是核苷酸和蛋白质序列(在 fasta/genbank/gff格式)和路线数据库(BLAST、Bowtie1/2)。在

数据是根据需要自动下载的,因此非常容易 对于Python项目使用和重复使用大肠杆菌的参考基因组, S、 cerevisiae等等,不用担心从NCBI手动下载。在

示例

让我们来获取大肠杆菌中所有蛋白质序列的Biopython记录:

fromgenome_collectorimportGenomeCollectioncollection=GenomeCollection()records=collection.get_taxid_biopython_records(511145,"protein_fasta")

就这样!如果你的机器上没有蛋白质数据,基因组 Collector从NCBI下载,并存储在您的“collection”中,以便下一个 时间你需要它。在

现在,让我们获取一个酿酒酵母的本地BLAST数据库的路径:

^{pr2}$

如果你的机器上没有酿酒数据库,基因组采集员 下载了基因组数据并建立了它。现在在你的收藏里,你呢 可以使用返回的db_path启动BLAST进程:

importsubprocessprocess=subprocess.run(['blastn','-db',db_path,'-query','queries.fa','-out','results.txt'])

信息

欢迎大家投稿!在

更多生物软件

https://raw.githubusercontent.com/Edinburgh-Genome-Foundry/Edinburgh-Genome-Foundry.github.io/master/static/imgs/logos/egf-codon-horizontal.png

基因组采集器是 EGF Codons 用于DNA设计、制造和验证的合成生物学软件套件。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java从Dropwizard中的Minio检索文件时,GET请求中的超时是如何处理的?   带Hibernate的java Jackson用于序列化以避免枚举   Raspberry Pi上的java Jave分段错误   java在屏幕旋转时不保存当前片段和数据   java War文件未在Heroku上正确部署   如何使用Java处理Selenium webdriver中的促销广告或cookie   java处理“用法:PApplet[options]<classname>[sketch args]”   java文本文件错误扫描程序   运行第一个JavaFX模块化程序时出现java异常   java将fileoutputstream转换为字符串   如何调试gstreamerjava?   java Spring RestTemplate ResponseBody类是什么样的   如何将JSON数组转换为Java列表。我在用斯文森   javascript在显示div按钮后进入新页面