无法从html文件中获取文本

2024-10-03 02:42:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个HTML,如下所示:

<span class="tips yjSt" id="takane">その日はじめ(寄り付き)から現在までで、最も高かった値段</span></dt>
</dl>
</div>
<div class="lineFi clearfix">
<dl class="tseDtl"><dd class="ymuiEditLink mar0">
<strong>189.1</strong><span class="date yjSt">(09:00)</span><span class="icoRealTime" title="リアルタイム"> </span></dd>
<dt class="title">安値<a class="tips alignPos" data-ylk="slk:word;pos:4" 

我试图提取189.1

soup = BeautifulSoup(html)
res = soup.find_all("dl", {"class": "ymuiEditLink mar0"})
print (res)

但结果是空列表


Tags: divtitlehtmldtresddclassstrong
1条回答
网友
1楼 · 发布于 2024-10-03 02:42:15

findall中提到的标记应该是dd

Ex:

html = """<span class="tips yjSt" id="takane">その日はじめ(寄り付き)から現在までで、最も高かった値段</span></dt>
</dl>
</div>
<div class="lineFi clearfix">
<dl class="tseDtl"><dd class="ymuiEditLink mar0">
<strong>189.1</strong><span class="date yjSt">(09:00)</span><span class="icoRealTime" title="リアルタイム"> </span></dd>
<dt class="title">安値<a class="tips alignPos" data-ylk="slk:word;pos:4" """
from bs4 import BeautifulSoup

soup = BeautifulSoup(html, "html.parser")
res = soup.find_all("dd", {"class": "ymuiEditLink mar0"})
print(res[0].strong.text)

输出:

189.1

相关问题 更多 >