Python中文
首页
教程
问答
标签
搜索
登录
注册
如何使用暴力方法解析HTML JSON字符串,或如何在Python中修复 "<type 'str'> "中的 "\xfc"
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个<code><type 'str'></code>变量,其中包含一些html。我的问题是,当打印到控制台时,这些特殊字符被编码成这样的<code>"\xfc"</code>,而不是{<cd3>}。在</p> <p>我已经试过了</p> <pre><code>html = html.encode('utf-8').decode('string_escape') </code></pre> <p>但没有成功。有谁能指引我正确的方向吗?在</p> <p>谢谢!在</p> <p><strong>更新:</strong></p> <p>这个问题还没有解决。下面是关于这个问题的更多信息。。。在</p> <p>我从一个外部源接收到一个json字符串,其中除了一些其他内容外,还包含html。我想用xpath以“强力方法”访问html,因为json结构经常更改。在</p> <p>所以我想用漂亮的汤。在</p> <p>为此,我将json字符串传递给json.loads()将它变成一个对象。然后我将json对象类型转换为一个纯字符串,并将其传递给beautiful soup。在</p> <p>这种方法效果很好,除了像ßüÄÜÜßäÜÜÜÜÜÜßäÜÜÜ。在</p> <p>解决这个问题的最佳方法是什么?在</p> <p>这是一些伪代码</p> ^{pr2}$ <p>这是beautiful soup返回的典型结果(参见<strong>Haus f\xfcr Belgien</strong>)</p> <p/> <pre><code> <div class="sr_color"> <div style="float:left"> <a class="sr_color" href=""> Haus f\xfcr Belgien </a> : <span> <span class="sr_num_color"> 5,0 </span> <span style="display:-moz-inline-box;display:inline-block;float:none;vertical-align:-1px" class="star"> <span style="width:65px"> &nbsp; </span> </span> </span> </div> </div> </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您确定您的主机支持unicode吗?Python可以很好地处理字符,但是当它被打印出来时,您的终端可能无法正确地解释它。尝试将字符串写入一个文件,并使用支持unicode的编辑器打开它(甚至可以是html文件并在浏览器中打开它)。在</p> <p>大多数终端仿真器支持多种编码,可以在它们的选项中设置(取决于所讨论的终端仿真器)。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
尽管Python中的所有内容都是引用,为什么Python导师在没有指针的列表中绘制字符串和整数?
5 回答
尽管python中的表达式为false,但循环仍在运行
9 回答
尽管python代码正确,但从nifi ExecuteScript处理器获取语法错误
4 回答
尽管Python在Neovim中工作得很好,但插件不能识别Neovim中的Python主机
10 回答
尽管python字典包含了大量的条目,但它并没有增长
8 回答
尽管python说模块存在,为什么我会得到这个消息?
5 回答
尽管setuptools和控制盘是最新的,但无法识别singleversionexternallymanaged
10 回答
尽管stdout和stderr重定向,但未捕获错误消息
5 回答
尽管Tensorboard的事件太大,但Tensorboard的步骤太少了
9 回答
尽管tkinter上的变量已更改,但显示未更改
1 回答
尽管try/except使用Python进行单元测试时出现断言错误
1 回答
尽管URL是sam,但仍会抛出“达到最大重定向”
1 回答
尽管url有效,Pandas仍读取url的\u csv错误
7 回答
尽管while中存在时间延迟,但LINUX线程的CPU利用率为100%(1)
8 回答
尽管x0在范围内,Scipy优化仍会引发ValueError
5 回答
尽管xpath正确,但使用selenium单击链接仍不起作用
10 回答
尽管下载了ffmpeg并设置了路径变量python,但没有后端错误
1 回答
尽管下载了i,但找不到型号“fr”
8 回答
尽管下载了plotnine包,但未获取名为“plotnine”的模块时出错
5 回答
尽管为所有行指定了权重,网格(0)仍不起作用
9 回答