如何从网页上抓取类名?

2024-10-03 11:16:24 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我想搜集的网站的HTML代码:

<div id="quranOutput">
  <a class="key" name="1:1"></a>
    <div class="verse ayahBox1" id="verse_1">

这是我在动态django scraper中使用的xpath,但它不起作用:

//div[@class="ayah language_6 text"]/a/@name

有人能帮我找出取回名字的正确方法吗(name=“1:1”)。你知道吗


Tags: djangokey代码namedivid网站html
1条回答
网友
1楼 · 发布于 2024-10-03 11:16:24

使用xpath:

//div[@id="quranOutput"]/a[@class="key"]/@name

>>> import lxml.html
>>> 
>>> root = lxml.html.fromstring('''
... <html>
...     <body>
...         <div id="quranOutput">
...             <a class="key" name="1:1"></a>
...             <div class="verse ayahBox1" id="verse_1"></div>
...         </div>
...     </body>
... </html>''')
>>> 
>>> print root.xpath('//div[@id="quranOutput"]/a[@class="key"]/@name')
['1:1']

相关问题 更多 >