匹配CSV中的多个列；如果相等，将值从一个CSV复制到另一个CSV

with open('csv1.csv', 'r') as f: first = {rows[0]: rows[1:] for rows in list(csv.reader(f))} with open('csv2.csv', 'r') as f: for row in csv.reader(f): if row[0] in first: # row[0] = url first[row[0]].append(row[2]) merged = [(k,) + tuple(v) for k, v in first.items()] with open('output.csv', 'w') as f: csv.writer(f).writerows(merged)

2条回答

网友

1楼 · 编辑于 2024-05-19 08:57:51

根据关于使用数据帧的建议，我最终实现了以下基于pd合并(). 在

df1 = pd.read_csv('csv1.csv')
df2 = pd.read_csv('csv2.csv')
result = pd.merge(df1, df2, on = ['empid', 'name', 'org', 'division', 'title', 'country', 'topic', 'time-on-topic'], how = 'right')
result.to_csv("output.csv")

网友

2楼 · 编辑于 2024-05-19 08:57:51

下面是一些可以实现您所需的代码：

COUNTRY_CSV1, TOPIC_CSV = 5, 6

with open('csv1.csv', 'r') as f:
    first = {(rows[COUNTRY_CSV1], rows[TOPIC_CSV1]): 
             rows for rows in list(csv.reader(f))}

COUNTRY_CSV2, TOPIC_CSV2, RATING_CSV2 = 1, 2, 3
with open('csv2.csv', 'r') as f:
    for row in csv.reader(f):
        key = row[COUNTRY_CSV2], row[TOPIC_CSV2]
        first.get(key, []).append(row[RATING_CSV2]

with open('output.csv', 'w') as f:
    csv.writer(f).writerows(first.values())

这个问题的主要逻辑变化是，这里我们使用一个二元组作为键（根据要求，特定的二元组表示国家、主题）。在

但是也有很多其他的清理，而不是拆分然后重新合并行，我们也保留了值中的“关键”部分。这种冗余使得编写代码更加简单。在

索引已更改为常量，以便更清楚地知道需要哪些字段。最后，将“if”语句替换为get方法调用，该方法将返回一个新列表。这看起来像是虚假的开销，但它不太可能较慢（甚至可能更快，Python中的性能很奇怪），但可能不太容易出错。在

相关问题更多 >

编程相关推荐

热门问题

热门文章