我尝试用Python中的以下命令序列替换Word文件中的子字符串。代码本身工作得非常好——即使是使用完全相同的Word文件,但是当将其嵌入到更大规模的项目结构中时,它会在确切的位置抛出一个错误。我不知道是什么原因造成的,因为它似乎与代码无关,对我来说似乎是不可复制的。在
旁注:我知道是什么导致了这个错误,它是Word文件中的一个德语'u',但是它是必需的,如果代码独立运行,删除它似乎不是正确的解决方案。在
#foo.py
from bar import make_wordm
def main(uuid):
with open('foo.docm', 'w+') as f:
f.write(make_wordm(uuid=uuid))
main('1cb02f34-b331-4616-8d20-aa1821ef0fbd')
在食品进口棒.py因为他做了重活。在
^{pr2}$在更大范围的上下文中嵌入相同代码时,将引发以下错误:
ERROR:root:message
Traceback (most recent call last):
File "FooBar.py", line 402, in foo_bar
bar = bar_constructor(bar_theme,bar_user,uuid)
File "FooBar.py", line 187, in bar_constructor
if(main(uuid)):
File "FooBar.py", line 158, in main
f.write(make_wordm(uuid=uuid))
File "/home/foo/FooBarGen.py", line 57, in make_wordm
search="00000000-0000-0000-0000-000000000000", replace=uuid)
File "/home/foo/FooBarGen.py", line 24, in zipinfo_contents_replace
contents = fd.read().replace(search, replace)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 2722: ordinal not in range(128)
INFO:FooBar:None
编辑:经过进一步的检查和调试,似乎是变量'uuid'导致了这个问题。当将参数作为全文字符串('1cb02f34-b331-4616-8d20-aa1821ef0fbd')而不是使用从JSON解析的变量时,它工作得非常好。在
编辑2:我不得不加上uuid = uuid.encode('utf-8', 'ignore')
,现在它工作得很好了。在
更改此行:
为此:
^{pr2}$ascii编码可以处理0到127之间的字符代码。您的文件包含的字符代码0xc3超出了范围。您需要选择其他编解码器。在
在过去,我经常遇到特殊字符的问题,我都是在读取时解码为Unicode,然后在写回文件时编码为utf-8。在
我希望这对你也有用。在
对于我的解决方案,我一直使用我在这个演示文稿中找到的东西 http://farmdev.com/talks/unicode/
所以我会用这个:
那么在你的代码上:
^{pr2}$然后在写的时候把编码设置回utf-8。在
我没有重复你的问题,所以这只是一个建议。希望有用
问题是Unicode和字节字符串的混合。Python2“有益地”尝试从一个到另一个进行转换,但默认使用
ascii
编解码器。在下面是一个例子:
你提到过从JSON读取UUID。JSON返回Unicode字符串。理想情况下,将所有文本文件解码为Unicode,以Unicode进行所有文本处理,并在写入存储时对文本文件进行编码。在“更大的框架”中,这可能是一个很大的移植工作,但本质上使用
^{pr2}$io.open
和编码来读取文件并解码为Unicode:请注意,
encoding
应该与您正在读取的文件的实际编码相匹配。这是你必须确定的。在正如您在编辑中发现的那样,一个快捷方式是将UUID从JSON编码回字节字符串,但目标应该是使用Unicode来处理文本。在
python3在默认情况下通过将字符串设置为Unicode来清理这个过程,并删除与byte/Unicode字符串之间的隐式转换。在
相关问题 更多 >
编程相关推荐