为什么html unescape不能在这里工作？

2024-09-24 22:29:42 发布

男 | 程序猿一只，喜欢编程写python代码。

我就是这样得到数据的：

page = requests.get('some website')
data = bs4.BeautifulSoup(page.content,"lxml")

我用这个来逃避：

^{pr2}$

当我试图对data的任何部分调用unescape（我认为这是一个字符串），它并没有按应该的方式执行取消映射。相反，它只返回我用（例如\u00e8）调用函数的字符串。在

但是，当我尝试调用html_unescape()时，它会工作，并传入我实际键入的字符串（例如html_unescape('\u00e8')）。在

为什么当我从beauthulsoup获得的数据中传入一段字符串时，它不起作用？在

Tags：数据字符串 data get html page some website

1条回答

网友

1楼 · 发布于 2024-09-24 22:29:42

标准Python将打印<type 'str'>而不是<class 'str'>您必须已收到自定义的str类。你需要找出它是从哪里来的（requests）？BeautifulSoup？）看看它支持什么操作。在