在python中使用组合文件

网友

1楼 · 编辑于 2024-05-20 22:04:55

我还没有评论权限，因此需要单独回答。在

只要您确定每个文件中都有相同的度量标识（顺序并不重要，但集合应该相等），jsbueno的答案就非常有效。在

在下列情况下：

file1:
measID,meas1
a,1
b,2

file2:
measID,meas1
a,3
b,4
c,5

你会得到：

^{pr2}$

而不是期望的：

outfile:
measID,meas1,meas2
a,1,3
b,2,4
c,,5        # measurement c was missing in file1!

我使用逗号而不是空格作为分隔符以更好地显示。在

网友

2楼 · 编辑于 2024-05-20 22:04:55

使用csv模块读取中的文件，创建度量名称的字典，并使字典中的值成为文件中值的列表。在

网友

3楼 · 编辑于 2024-05-20 22:04:55

对于今天的台式计算机来说，这是一个很小的数据量（大约150000个测量值），因此将所有数据都保存在内存中，并将其转储到单个文件中比另一种策略更容易。如果它不适合RAM，那么使用SQL可能是一个不错的方法- 但实际上，您可以创建一个默认字典，其中每个元素都是一个列表- 阅读所有文件并将测量数据收集到字典中，并将其转储到磁盘-

# create default list dictionary:
>>> from collections import defaultdict
>>> data = defaultdict(list)
# Read your data into it:
>>> from glob import glob
>>> import csv
>>> for filename in glob("my_directory/*csv"):
...    reader = csv.reader(open(filename))
...    # throw away header row:
...    reader.readrow()
...    for name, value in reader:
...       data[name].append(value)
... 
>>> # and record everything down in another file:
... 
>>> mydata = open("mydata.csv", "wt")
>>> writer = csv.writer(mydata)
>>> for name, values in sorted(data.items()):
...    writer.writerow([name] + values)
... 
>>> mydata.close()
>>>

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中使用组合文件

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >