我在学Python爬行。 我只想从html代码中提取文本。你知道吗
例如,在html中
<div class='titleArea'>
"~~~~~ text~~~~"
</div>
所以,我写了这个代码来提取文本
title_temp = soup.findAll('div',class_='titleArea')
print(title_temp)
**我知道打印(title\u temp[0].text),但这无关紧要
结果是
这张照片的内容是
[<div class='titleArea'>
@#$!$^!@#!@^#!$^!@#!@#!@#
</div>]
[<div class='titleArea'>
@#$!$^!@#!@^#!$^!@#!@#!@#
</div>]
***有两个列表的原因重复。你知道吗
我不想听到那条短信。你知道吗
我该怎么办?你知道吗
我想是utf-8的问题。你知道吗
是吗?你知道吗
所以
是我写的
# -*- coding: utf-8 -*-
但是,没有效果。你知道吗
输出:
chartset
位于html头标记中:编辑: 更优雅的方式:
这将自动设置编码。你知道吗
相关问题 更多 >
编程相关推荐