Python中文
首页
教程
问答
标签
搜索
登录
注册
使用BeautifulSoup提取标记中的文本
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我试图在一个网站的源代码中使用beauthoulsoup来获取文本。<strong>部分</strong>源代码如下所示:</p> <pre><code> <hr /> <div class="see-more inline canwrap" itemprop="genre"> <h4 class="inline">Genres:</h4> <a href="/genre/Horror?ref_=tt_stry_gnr" > Horror</a>&nbsp;<span>|</span> <a href="/genre/Mystery?ref_=tt_stry_gnr" > Mystery</a>&nbsp;<span>|</span> <a href="/genre/Thriller?ref_=tt_stry_gnr" > Thriller</a> </div> </code></pre> <p>所以我一直在尝试用这些代码提取“恐怖”、“神秘”和“惊悚”:</p> ^{pr2}$ <p>但回报是:</p> <pre><code>['\n', <h4 class="inline">Genres:</h4>, '\n', <a href="/genre/Horror? ref_=tt_stry_gnr"> Horror</a>, '\xa0', <span>|</span>, '\n', <a href="/genre/Mystery?ref_=tt_stry_gnr"> Mystery</a>, '\xa0', <span>|</span>, '\n', <a href="/genre/Thriller?ref_=tt_stry_gnr"> Thriller</a>, '\n'] </code></pre> <p>我对python和webscraping还是个新手,所以我希望能得到所有的帮助。谢谢!在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>试试这个,我在用html.parser. 如果您遇到任何问题,请告诉我们:</p> <pre><code> for data in genre1: get_a = data.find_all("a") text = "" for i in get_a: text = i.text print(text) </code></pre> <p>我用手机时请检查压痕。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何制作pyIns
7 回答
如何制作PySide.QtCore.QTimer.singleShot调用其超时方法
3 回答
如何制作python cod的安装程序或exe
5 回答
如何制作Python flickrgui?
5 回答
如何制作Python IRC机器人?
1 回答
如何制作python ursina引擎的立方体纹理
9 回答
如何制作python3.6的python3.8访问模块?
6 回答
如何制作pythonb的多个文件
2 回答
如何制作pythonmysqldb模板?
1 回答
如何制作python加密程序?
6 回答
如何制作python包?
5 回答
如何制作python回复sub不会错过模式
1 回答
如何制作python对象组合(列表对象中的列表对象)
8 回答
如何制作Python打印循环
3 回答
如何制作python数组类的副本?
6 回答
如何制作python日期时间.strptime考虑过时区吗?
1 回答
如何制作python模块或函数,并在编写其他程序时使用它?
2 回答
如何制作python正则表达式?
9 回答
如何制作python的内置http.sever服务器代理wsgi请求
3 回答
如何制作python的内置打印功能,在gui上制作标签(我正在制作REPL),而不是打印到控制台?
5 回答