将文件读入字符串(python)

2024-06-01 22:11:06 发布

您现在位置:Python中文网/ 问答频道 /正文

我刚刚在Windows10机器上安装了Anaconda(Python2.7.12 | Anaconda4.2.0(64位)|) 从文件中读取文本时遇到问题。 请参阅下面的代码和输出。我要文件中的实际文本。在

谢谢!!在

输出:

 ['\xff\xfeT\x00h\x00i\x00s\x00',
  '\x00i\x00s\x00',
   '\x00a\x00',
   '\x00t\x00e\x00s\x00t\x00.\x00',
   '\x00',
   '\x00',
   '\x00',
   '\x00T\x00h\x00i\x00s\x00',
   '\x00i\x00s\x00',
   '\x00a\x00',
   '\x00t\x00e\x00s\x00t\x00']

代码:

^{pr2}$

在测试.txt公司名称:

This is a test.

This is a test

Tags: 代码test文本机器isanacondathisx00
2条回答

文本编码有问题。您的文件不是用UTF-8编码的,而是用UTF-16编码的。不要使用“打开”,请使用:

import codecs
with codecs.open("test.txt", "r", encoding="utf-16") as f:
    text = f.read()

或者切换到Python3,它对unicode有更好的支持。在

我很幸运地使用了io模块以显式编码打开文件。在

import io
with io.open(FILE, 'r', encoding='utf-16') as f:
    job = f.read()

相关问题 更多 >