在SAM格式中,每条对齐线表示线段的线性对齐,每条线有11个必填字段,即QNAME、FLAG、RNAME、POS、MAPQ等
假设我想要一个给定BAM文件中所有“QNAMES”的NumPy数组。或者,可以将多个列导入数据帧。你知道吗
pysam可以实现这个功能吗?你知道吗
人们可以自然地用pysam.AlignmentFile()
打开给定的BAM文件,然后用pysam.AlignmentSegment()
访问各个段,例如
seg = AlignmentSegment()
print(seg.qname)
但是,您能否将所有qname保存到NumPy数组中?你知道吗
是的,这是可行的。请注意,出于您的目的,从带有
pysam
的BAM文件导入读取时,最好使用fetch()
函数,该函数在BAM文件中的所有读取(pysam.AlignmentSegment()
对象)上创建迭代器。然后使用query_name
函数检索QNAME:这里,
qnames
是BAM文件中所有qname的列表。如果您坚持要获取NumPy数组,只需在末尾添加以下行:相关问题 更多 >
编程相关推荐