回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有一堆CSV文件,我试图连接成一个单一的CSV文件。CSV文件由一个空格隔开,如下所示:</p>
<pre><code>'initial', 'pos', 'orientation', 'ratio'
'chr', '106681', '+', '0.06'
'chr', '106681', '+', '0.88'
'chr', '106681', '+', '0.01'
'chr', '106681', '+', '0.02'
</code></pre>
<p>如您所见,除了<code>ratio</code>,所有值都是相同的。我创建的连接文件如下所示:</p>
^{pr2}$
<p>所以基本上,我将遍历每个文件,只存储<code>initial</code>,<code>pos</code>,<code>orientation</code>的一个值,但存储{<cd1>}的所有值,并更新连接文件中的表。事实证明这比我想象的要混乱得多。我有以下代码来读取csv文件:</p>
<pre><code>concatenated_file = open('josh.csv', "rb")
reader = csv.reader(concatenated_file)
for row in reader:
print row
</code></pre>
<p>它给出了:</p>
<pre><code>['chrom', 'pos', 'strand', 'meth_ratio']
['chr2', '106681786', '+', '0.06']
['chr2', '106681796', '+', '0.88']
['chr2', '106681830', '+', '0.01']
['chr2', '106681842', '+', '0.02']
</code></pre>
<p>如果有人能告诉我如何只存储<code>initial</code>,<code>pos</code>,<code>orientation</code>的一个值(因为它们保持不变),但是{<cd1>}的所有值都是存储的,这将非常有帮助</p>