如何在“th”语句中按关键字刮表

2条回答

网友

1楼 · 编辑于 2024-09-29 23:18:43

使用正则表达式查找文本，然后查找\u next（'td'）标记。你知道吗

from bs4 import BeautifulSoup
import requests
import re
data=requests.get('https://www.amazon.com/dp/B07G5MZNJ4').text
soup=BeautifulSoup(data,'html.parser')
table = soup.find('table', attrs={'id':'product-specification-table'})
item=table.find('th',text=re.compile('Part Number'))
MFG_NO=item.find_next('td').text
print(MFG_NO.strip())

输出：

PV-923/1

网友

2楼 · 编辑于 2024-09-29 23:18:43

我倾向于使用：contains和bs4.7.1，然后使用combinator获得下一个同级td

import requests
from bs4 import BeautifulSoup as bs

r = requests.get('https://www.amazon.com/dp/B07G5MZNJ4/?tag=stackoverfl08-20', headers = {'User-Agent':'Mozilla/5.0'})
soup = bs(r.content, 'lxml')

if soup.select_one('title').text == 'Robot Check':
    print('bad luck')
else:
    part_number = soup.select_one('th:contains("Part Number") + td')
    if part_number is None:
        part_number = 'Not found'
    else:
        part_number = part_number.text.strip()
    print(part_number)

输出：

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在“th”语句中按关键字刮表

输出：

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >