在Python中逐行读取大型文本文件

2024-09-24 06:32:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图逐行将一个.txt文件(从终端输出)读入Python。以下是文件的前几行:

new/2017_01_13_11_28_48_read_1062_reply_12_海鸥86_STRNAT_ADD.txt;new/2017_01_25_21_20_20_read_51_reply_0_尔乐乎_STRNAT_REG.txt;0%
new/2017_01_13_11_28_48_read_1062_reply_12_海鸥86_STRNAT_ADD.txt;new/2017_01_07_10_48_26_read_393_reply_1_自然向前_STRNAT_REG.txt;0%
new/2017_01_13_11_28_48_read_1062_reply_12_海鸥86_STRNAT_ADD.txt;new/2017_01_04_13_58_53_read_48_reply_0_外星人社会_STRNAT_REG.txt;0%
new/2017_01_13_11_28_48_read_1062_reply_12_海鸥86_STRNAT_ADD.txt;new/2017_01_31_23_07_06_read_743_reply_3_海堤梦言_STRNAT_REG.txt;0%

我知道迭代行比f.readlines()更好。当我运行下面的代码时,它看起来可以读入,但是输出的第一行与文件的第一行不同

我尝试检查文本文件的编码,并将其重新编码为“utf-8”。我试过在文本编辑器中检查它是否有问题。这是我的密码:

with open('/Users/nicholasolczak/Desktop/sherlock-master/results2.txt') as f:
    for line in f:
        print(line.strip())
f.close()

我希望它能逐行打印文件。但是控制台输出的第一行:

82_reply_1_世界公民。_STRNAT_Rnew/2017_01_26_22_19_46_read_13_reply_0_海鸥86_STRNAT_ADD.txt;new/2017_01_26_04_50_00_read_0_reply_0_NOAUT_RMW_REG.txt;0%
new/2017_01_26_22_19_46_read_13_reply_0_海鸥86_STRNAT_ADD.txt;new/2017_01_01_13_44_00_read_0_reply_0_NOAUT_RMW_REG.txt;0%

非常感谢您的帮助。我是新来的


Tags: 文件txtadd终端编码newreadline