为什么html unescape不能在这里工作?

2024-09-24 22:29:42 发布

您现在位置:Python中文网/ 问答频道 /正文

我就是这样得到数据的:

page = requests.get('some website')
data = bs4.BeautifulSoup(page.content,"lxml")

我用这个来逃避:

^{pr2}$

当我试图对data的任何部分调用unescape(我认为这是一个字符串),它并没有按应该的方式执行取消映射。相反,它只返回我用(例如\u00e8)调用函数的字符串。在

但是,当我尝试调用html_unescape()时,它会工作,并传入我实际键入的字符串(例如html_unescape('\u00e8'))。在

为什么当我从beauthulsoup获得的数据中传入一段字符串时,它不起作用?在


Tags: 数据字符串datagethtmlpagesomewebsite
1条回答
网友
1楼 · 发布于 2024-09-24 22:29:42

标准Python将打印<type 'str'>而不是<class 'str'>您必须已收到自定义的str类。你需要找出它是从哪里来的(requests)?BeautifulSoup?)看看它支持什么操作。在

相关问题 更多 >