如何在python中处理pd.read_csv函数中的多个分隔符？

2条回答

网友

1楼 · 编辑于 2024-09-28 13:29:41

希望这有帮助。您可以使用分隔符或Sep.referepythonDocumentation

\s - Matches any whitespace character; this is equivalent to the set [ \t\n\r\f\v].

import pandas as pd
my_cols = [str(i) for i in range(45)] # create some row names
dataset = pd.read_csv('/Data/formatted1.csv', sep="\s+|;|,", names=my_cols, header=None, engine="python")

感谢@Tai

网友

2楼 · 编辑于 2024-09-28 13:29:41

IMHO，你可以用正则表达式

import pandas as pd

df = pd.read_csv(PATH, sep=r'[,|;\t"]+(?=\S)', engine='python')

这里有一些例子

from io import StringIO
import pandas as pd

s1 = """a|b|c
1|2|3
"""

s2 = """a;b;c
1;2;3
"""

print(pd.read_csv(StringIO(s1), sep=r'[,|;\t"]+(?=\S)', engine='python'))
print()
print(pd.read_csv(StringIO(s2), sep=r'[,|;\t"]+(?=\S)', engine='python'))

   a  b  c
0  1  2  3

   a  b  c
0  1  2  3

编程相关推荐

java如何从IBM MQ的JMSException检测可恢复错误
java Lucene6。4.2:找不到类，尝试添加查询。
Java Pdf差异库
在Java中多线程处理我的线程
java将字符串传递给Uri。下载中的parse（）
java在列表中查找原语位置
java JPA条件从另一个查询中选择
java中的强制转换和转换
java如何在没有上下文的情况下获取SOAP Web服务（Apache Axis 1.4）的调用客户端的IP地址
java Android IllegalBlockSizeException:解密中最后一个块未完成

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在python中处理pd.read_csv函数中的多个分隔符？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >