googletranslate在python3中输出HTML实体

2024-09-25 08:26:44 发布

您现在位置:Python中文网/ 问答频道 /正文

当我试图将法语字符写入文件时,有些字符看起来像

j'ai

我对西班牙语字符没有任何问题。我会做错什么?在

^{pr2}$

打印结果:

0 J'ai dit, vous savez quoi, quelque chose, je vais laisser tomber tout ce que je faisais et traverser une période de sécheresse simplement pour lui donner une chance de bien commencer à l'utiliser.

请忽略我翻译的是字符串列表而不是字符串。我在测试发送批处理请求。在


Tags: 文件字符串de字符ai我会jedit
1条回答
网友
1楼 · 发布于 2024-09-25 08:26:44

编辑


好吧,正如预期的那样,问题出在字符串而不是字幕生成上。在

googletranslateapi指定它的输出默认为HTML。这就是为什么你得到的是HTML实体而不是原始字符。在

您需要在translate方法的调用中指定希望格式为文本而不是HTML。在

比如:

translate_client.translate(
        test_list[j:j + 128], 
        target_language=target,
        format="text")

有关参数的详细信息,请访问: https://cloud.google.com/translate/docs/reference/translate?hl=ja

更多关于Python API本身的详细信息,请参阅此处的源代码: https://github.com/googleapis/google-cloud-python/blob/master/translate/google/cloud/translate_v2/client.py#L164

编辑结束


在我回答之前,我会给你一些建议,因为你似乎是新来的: 如果您需要代码帮助,您应该提供一个完整的工作示例。 当一个人不能提供所需的所有背景和信息时,帮助他们真的很难。在

那么,让我们来回答。。。在

我将从一个疯狂的猜测开始:

您正在使用位于以下位置的srt库创建子标题文件: https://github.com/cdown/srt

我刚刚用下面的代码测试了它:

^{pr2}$

它显示撇号很好。在

您应该检查sub的内容和parse函数使用的原始文本。很有可能问题出在原始文本,而不是python打印,因为在编写过程中没有自动将字符转换为HTML实体的内容。在

相关问题 更多 >