我们有一个本地的EnsEMBL MySQL数据库,包含注释过的蚊子基因组。在
PyCogent食谱指出Here您可以通过cogent.db.ensembl.HostAccount
模块从本地MySQL EnsEMBL数据库访问/查询数据。Here是PyCogent的ensemblapi的源代码。在
但是我无法访问数据,因为函数假设我知道我试图查询其基因组的物种(字符串)的确切名称。。。在网上搜索了几个小时之后,如果有人能告诉我如何列出物种的名称(PyCogent会理解),这样我就可以最终查询本地数据库中的基因组数据了。在
此代码显示了我的问题,请注意注释:
Release = 73
from cogent.db.ensembl import HostAccount, Genome
acc = HostAccount('localhost', 'username1', 'password1') # login details to MySQL server
genome = Genome(Species='?????',Release=73,account=acc) # Where can I find the available Species list so I can replace the '?????'
在@dpryan79(来自Biostars)的一个有用的提示之后,我查看了PyCogent的源代码,结果发现我可以查看可用物种名称的唯一方法是实际登录MySQL服务器并列出数据库,数据库名称本身需要一个命名约定,其中前两个由下划线(Uu)分隔的字符串是分别为属名和种名。在
所以通过终端登录mysql服务器:
然后键入:
^{pr2}$具体地说,我可以查看以下两个数据库的名称:
建议我有以下可用的物种:}
anopheles gambiae, anopheles arabeinsis, anopheles funestus
和{相关问题 更多 >
编程相关推荐