如何根据每行的第一个字符将文本数据迭代写入新文件？

100000054896524Textext 30000680235498065464065 texttext 50005065321465406546406 16227322 7000056432586846403546854065354096 50046540632146540665406 16268431 7000066543241564786413468464163156 30065406346840654065486 TEXTETXT

with open('test_file.txt','r') as file_handle: file_content = file_handle.read() with open('file1.txt', 'w') as file_handle: for line in file_content: if line[0] == '1': file_handle.write(line+'\n') with open('file3.txt', 'w') as file_handle: for line in file_content: if line[0] == '3': file_handle.write(line+'\n')

3条回答

网友

1楼 · 编辑于 2024-05-19 19:17:42

与其为每个文件单独调用open，不如使用字典更干净。下面是一个工作示例：

output = {}

with open('testfile.txt') as f:
    for line in f:
        start_char = line[0]
        if start_char not in output:
            output[start_char] = []
        output[start_char].append(line)

for start_char in output.keys():
    with open('file{}.txt'.format(start_char), 'w') as f:
        f.writelines(output[start_char])

网友

2楼 · 编辑于 2024-05-19 19:17:42

使用readlines()代替read()（第2行）

使用file_handle.read()而不是file_handle.readlines()将返回一个字符串，因此使用file_handle.read()将逐字符迭代

使用readlines()将逐行迭代，因为该函数将返回一个列表

网友

3楼 · 编辑于 2024-05-19 19:17:42

read将文件作为单个字符串读取。迭代时，是逐字符而不是逐行迭代。您可以使用file_content = file_handle.readlines()以便迭代行而不是字符

不要为每个文件复制代码，而是设置缓存，让脚本动态创建文件

# will hold open file objects for "file0.txt", ..., "file9.txt"
# as needed
file_cache = [None] * 10

try:
    with open('test_file.txt') as file_handle:
        for line in file_handle:
            num = int(line[0])
            if file_cache[num] is None:
                file_cache[num] = open(f"file{num}.txt", "w")
            file_cache[num].write(line)
# todo: May want to catch exceptions and delete all files on fail
# except:...
finally:
    for fp in file_cache:
        if fp:
            fp.close()

相关问题更多 >

编程相关推荐

热门问题

热门文章