解析文本文件时出现问题（编码？）

2条回答

网友

1楼 · 编辑于 2024-09-22 14:38:55

实际上，您的文件似乎编码为UTF-16：

$ file ~/Downloads/dota_english.txt
~/Downloads/dota_english.txt: Little-endian UTF-16 Unicode C++ program 
text, with very long lines, with CRLF line terminators

这符合您看到“每个字符之间的空格”的描述（UTF-16是两字节编码；对于ASCII文本，这意味着每个字符表示为ASCII的一个字节，后跟一个空字节，给出文本中的空格）。你知道吗

您可以尝试在加载文件时指定编码，例如使用^{} module：

import codecs
import vdf
d = vdf.load(codecs.open('dota_english.txt', 'r', encoding='utf-16'))

网友

2楼 · 编辑于 2024-09-22 14:38:55

它看起来像一种json文件，里面有xml。你能上传你的源代码吗？有许多json解析器。您可以使用内置的json模块和xmllib。你知道吗

编程相关推荐

java有没有一种在openGL上绘制立方体而不必指定每个坐标的方法？
java如何在安卓中实用地改变开关按钮的内部颜色？
java调用系统。gc（）导致JSP中的数据丢失
如何使用ApachePDFBOx2.0.8在Java Swing框架中可视化pdf，而不将其转换为图像
具有可空值的java筛选列表
java降低安卓中颜色的亮度？
java JSF/CDI依赖项注入ActionListener
java如何使EditTextView上的可见和不可见绘图向左？
java hibernate。cfg。在spring mv3应用程序中找不到xml
javascript如何用Java解析请求？

相关问题更多 >

编程相关推荐

热门问题

热门文章

解析文本文件时出现问题（编码？）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >