如何在Python中按多个列合并2个CSV文件

Ticker | Date | Marketcap A | 2002-03-14 | 600000 A | 2002-06-18 | 520000 . . ABB | 2004-03-16 | 400000 ABB | 2005-07-11 | 800000 . . AD | 2004-03-16 | 680000 . .

Ticker | Date | Marketcap | Open | Close | A | 2002-03-14 | 600000 | 580000 | 500000 | ABB | 2002-03-14 | 520000 | 500000 | 420000 | . .

3条回答

网友

1楼 · 编辑于 2024-09-27 19:21:53

试试这个：

 merged=a.merge(b, how='left',on=['Ticker', 'Date'])

网友

2楼 · 编辑于 2024-09-27 19:21:53

您可以尝试以下代码：

a = pd.read_csv("File1.csv", "\t")
b = pd.read_csv("File2.csv", "\t")
merged = pd.merge(a, b, how='inner', on=['Ticker', 'Date'])
print merged

如果File1.csv是：

^{pr2}$

而File2.csv是：

Ticker  Date    Open    Close
A   2002-03-14  580000  500000
ABB 2004-03-16  500000  420000
AD  2004-03-16  700000  670000

则上述代码的输出为：

  Ticker        Date  Marketcap     Open   Close
0      A  2002-03-14      600000  580000  500000
1    ABB  2004-03-16      400000  500000  420000
2     AD  2004-03-16      680000  700000  670000

如果您希望File1.csv中的所有行，并且只希望File2.csv中的行匹配，则可以使用以下方法：

merged = pd.merge(a, b, how='left', on=['Ticker', 'Date'])

这将产生：

  Ticker        Date  Marketcap       Open     Close
0      A  2002-03-14      600000  580000.0  500000.0
1      A  2002-06-18      520000       NaN       NaN
2    ABB  2004-03-16      400000  500000.0  420000.0
3    ABB  2005-07-11      800000       NaN       NaN
4     AD  2004-03-16      680000  700000.0  670000.0

网友

3楼 · 编辑于 2024-09-27 19:21:53

我相信您需要使用['Date', 'Ticker']，而不是仅仅使用'Date'。另外，您可能需要根据需要指定how参数。在

相关问题更多 >

编程相关推荐

热门问题

热门文章