Python中文
首页
教程
问答
标签
搜索
登录
注册
(python)使用漂亮的soup解析某些HTML输出标记
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>您好:)经过一段时间的研究,我想出了以下函数,它返回完整的HTML标记,而不是简单地返回倒置的部分<;<em>>;“this”<;</em>></p> <pre><code>from BeautifulSoup import BeautifulSoup from urllib2 import urlopen def get_wotd(): return str((BeautifulSoup(urlopen('http://www.reference.com/wordoftheday'))).findAll('h2')) print get_wotd() </code></pre> <p>例如,今天的单词是“nosh”。而不是得到:</p> ^{pr2}$ <p>我需要的输出是,简单地说</p> <pre><code>nosh </code></pre> <p>有人知道我怎么才能做到吗?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>使用<code>lxml</code>而不是BeautifulSoup:</p> <pre><code>>>> from lxml.html import parse >>> tree = parse("http://www.reference.com/wordoftheday") >>> tree.xpath("//h2")[0].text 'nosh' </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
在python3中使用Scipy pearsonr函数
7 回答
在Python3中使用scipy对多个lorentzian进行数据拟合
8 回答
在Python3中使用Script=argv
8 回答
在python3中使用selenium webdriver进行未解析的回溯
4 回答
在python3中使用selenium和phantomjs的网页截图之前如何等待?
10 回答
在Python3中使用Selenium和Requests模块从网页获取文件
7 回答
在python3中使用SIGINT终止函数
8 回答
在Python3中使用SIGTERM时,允许进程完成而不是中断
6 回答
在python3中使用smtplib发送XML内容
4 回答
在python3中使用socket库(RFCOMM模式)重新连接蓝牙设备?
3 回答
在python3中使用sounddevice和numpy编写wav文件
9 回答
在python3中使用Sqlalchemy插入MySQL查找类型错误的原因
5 回答
在python3中使用sqlite、pandas和sqlalchemy很难让rollback工作
2 回答
在python3中使用SQLite的FTS3/4
7 回答
在Python3中使用struct.calcsize()和len()有区别吗?
10 回答
在python3中使用substring函数时发生TypeError
8 回答
在Python3中使用Tkinter entry小部件写入串行设备
5 回答
在python3中使用tkinter时,如何在每次按下函数时获得运行该函数的按钮?
8 回答
在python3中使用tkinter的子帧
10 回答
在Python3中使用tryexcept块时,如何避免使用未初始化的变量?
10 回答