我就是这样得到数据的:
page = requests.get('some website')
data = bs4.BeautifulSoup(page.content,"lxml")
我用这个来逃避:
^{pr2}$当我试图对data
的任何部分调用unescape(我认为这是一个字符串),它并没有按应该的方式执行取消映射。相反,它只返回我用(例如\u00e8
)调用函数的字符串。在
但是,当我尝试调用html_unescape()
时,它会工作,并传入我实际键入的字符串(例如html_unescape('\u00e8')
)。在
为什么当我从beauthulsoup获得的数据中传入一段字符串时,它不起作用?在
标准Python将打印
<type 'str'>
而不是<class 'str'>
您必须已收到自定义的str
类。你需要找出它是从哪里来的(requests
)?BeautifulSoup
?)看看它支持什么操作。在相关问题 更多 >
编程相关推荐