读取一列有多个条目的数据

name nr rep meters Bill 0 1 135 Chill 0 2 81, 81 Billy 5 6 175, 205, 187, 174, 240, 198 Sambouka 5 7 130, 113, 117, 118, 130 Chile 0 1 120

3条回答

网友

1楼 · 编辑于 2024-09-29 01:34:16

您也只能使用而不是前面带有逗号的任意数量的空格作为分隔符，使用regex负lookback：

data = pd.read_csv('data.dat', sep='(?<!,)\s+')

如果您还想忽略后跟逗号的空格，请添加一个负数：

data = pd.read_csv('data.dat', sep='(?<!,)\s+(?!,)')

分割之后，组合值当然是一个字符串，而不是一个列表。您的示例由28个字符组成，因此输出是您所期望的。你知道吗

您可以使用列表理解将此字符串转换为整数的Python列表：

my_list_of_ints = [int(n) for n in my_string.split(",")]

或者使用内置的map函数：

my_list_of_ints = map(int, my_string.split(","))

网友

2楼 · 编辑于 2024-09-29 01:34:16

尝试此操作，将仅考虑2个或更多空间作为分隔符：

data = pd.read_csv('data.dat', sep='\s{2,}')

添加以下图片以进行澄清：

网友

3楼 · 编辑于 2024-09-29 01:34:16

这会完成的

data = pd.read_csv('data.dat', delim_whitespace=True)

编辑