将文本文件读入pandas数据帧或numpy数组

网友

1楼 · 编辑于 2024-10-03 17:20:20

你试过分别处理每一项吗？在

例如：

打开文档：

with open('delimiters.txt') as r:
    lines = r.readlines()
    linecontent = ' '.join(lines)

为每个项目创建列表：

^{pr2}$

创建ID和频率的子列表：

newResult = [result[x:x+2] for x in range(0, len(result), 2)]

使用每种数据类型：

ids = [x[0][:] for x in newResult]
freq = [x[1][:] for x in newResult]

创建数据帧

df = pandas.DataFrame({'A ids': ids, 'B freq': freq})

{a1}

网友

2楼 · 编辑于 2024-10-03 17:20:20

好吧，这并不理想，但你可以使用记事本++。在

它具有“查找并替换”功能，您可以使用\t将制表符替换为\n

然后可以录制一个宏，将任何给定行移到上一行，跳过行。在

然后你可以用熊猫，pd.from\u csv但是必须将分隔符定义为制表符而不是逗号

另一个选择是读取每一行，并分别处理它。基本上是一个while循环，条件不是m_line==null

然后在循环内部，用结构分裂（）

为每一行创建一个字典。最后，您将得到一个字典列表，其中每个条目都是ID:frequency

网友

3楼 · 编辑于 2024-10-03 17:20:20

这是我所做的。这将创建一个包含键值对的字典从每一行。在

data = []

with open('../data/input.mat', 'r') as file:
    for i, line in enumerate(file):
        l = line.split()
        d = dict([(k, v) for k, v in zip(l[::2], l[1::2])])
        data.append(d)

相关问题更多 >

编程相关推荐

热门问题

热门文章

将文本文件读入pandas数据帧或numpy数组

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >