用于从bgen文件加载数据的包

bgen的Python项目详细描述


另一个bgen阅读器

travis

这是一个用于读取bgen files的包。在

这个包使用cython包装用于解析bgen文件的c++代码。这是公平的 很快,它可以分析500000个个体的基因型,每种变异大约300个 在单个python进程中的第二个(每秒约4.5亿个概率 使用3GHz CPU)。降低基因型概率是一个缓慢的步骤, 使用zstd压缩基因型,zlib减压占总时间的80% 会快得多,可能快2-3倍?在

这已经为UKBiobank bgen文件(即bgen版本1.2和 zlib压缩了8位基因型概率,但是其他bgen版本和 zstd压缩也已经用bgen文件进行了测试)。在

安装

pip install bgen

用法

frombgenimportBgenFilebfile=BgenFile(BGEN_PATH)rsids=bfile.rsids()# select a variant by indexingvar=bfile[1000]# pull out genotype probabilitiesprobs=var.probabilities# returns 2D numpy arraydosage=var.minor_allele_dosage# returns 1D numpy array for biallelic variant# iterate through every variant in the filewithBgenFile(BGEN_PATH,delay_parsing=True)asbfile:forvarinbfile:dosage=var.minor_allele_dosage# get all variants in a genomic regionvariants=bfile.fetch('21',10000,5000000)
API文档 ^{pr2}$

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java将spring j_spring_安全检查迁移到登录   log4j2中自定义appender中AppConfig的java问题   在将java转换为Json时是否可以忽略内部类名和变量   用java将PDF文件转换为十六进制格式   java将值从AsyncTask返回到主类   java如何导入带有部署变量类名的静态函数?   java Spring Boot@ConfigurationProperties未从环境检索属性   java为什么API调用需要80毫秒的延迟才能到达控制器(在Google应用程序引擎中)?   XML配置中MarshallingMessageConverter中的java设置MarshallTo获取无效属性“MarshallTo”   java从群中获取facebook帖子   @ComponentScan的java excludeFilters不起作用   java将单选按钮值从一个类传递到另一个类   java使JTextArea在Swing中可滚动   java Android增强现实应用程序:将球坐标旋转到设备坐标系