我有两个包含4.txt文件的数据集,每个文件有9列。我的任务是制作一个非常简单的条形图,显示两个数据集中每个文件的第6列和第7列之间的比较。我当然会接受cols 1、2和3作为默认值。我用python编写了一些代码,但是在读取多个文件和选择列时遇到了困难。目前我的代码如下:
# This script will plot the comparison between the BodyMap Gencode & BodyMap RefSeq paired end data.
import matplotlib.pyplot as plt
import numpy as np
#Reading in the files
with open("Illumina_Heart_Gencode_Aligned_Novel_Junctions.txt") as f:
data = f.read()
data = data.split('\n')
x = [row.split(' ')[0] for row in data]
y = [row.split(' ')[1] for row in data]
fig = plt.figure()
ax1 = fig.add_subplot(111)
ax1.set_title("BodyMap Gencode Vs. RefSeq")
ax1.set_xlabel("Novel & Splice Junctions")
ax1.set_ylabel("Something")
ax1.plot(x,y, c='r', label='the data')
leg = ax1.legend()
plt.show()
我想就如何向前迈进提出一些建议。在
谢谢你抽出时间。在
这就是我的数据。在
文件1:
^{pr2}$文件2:
chr1 880181 880421 2 2 0 15 0 21
chr1 1718493 1718764 2 2 0 12 0 24
chr1 8568735 8585817 2 2 0 12 0 21
chr1 8617583 8684368 2 2 0 14 0 23
chr1 8928117 8930883 2 2 0 56 0 24
chr1 8930943 8931949 2 2 0 48 0 25
chr1 9616316 9627341 1 1 0 12 0 24
chr1 9982417 9991948 2 2 0 18 0 23
chr1 10002841 10003306 2 2 0 17 0 20
chr1 10002841 10003406 2 2 0 21 0 25
chr1 10166642 10167279 1 1 0 31 1 24
chr1 10167433 10177516 1 1 0 96 0 24
chr1 10338187 10339154 1 1 0 29 0 23
chr1 10338187 10342379 1 1 0 11 0 23
我想比较两个文件中的第6列和第7列,在我的数据集中有多个这样的文件。在
在numpy.loadtxt文件当然可以节省许多行代码,但这只是在没有缺少值的情况下(例如,不完整的行)。如果是这种情况,那么手动方法(如您所做的)是最好的。在
相关问题 更多 >
编程相关推荐