使用python beautifulsoup进行Web爬网

2024-05-02 05:17:38 发布

您现在位置：Python中文网/ 问答频道 /正文

6849

网友

男 | 程序猿一只，喜欢编程写python代码。

如何提取<p>段落标记和<li>内的数据，它们位于命名的<div>类下？在

Tags：数据 div li 命名段落标记

1条回答

网友

1楼 · 发布于 2024-05-02 05:17:38

使用函数^{}和^{}：

import requests
from bs4 import BeautifulSoup

url = '...'

r = requests.get(url)
data = r.text
soup = BeautifulSoup(data, 'html.parser')

div = soup.find('div', {'class':'class-name'})
ps = div.find_all('p')
lis = div.find_all('li')

# print the content of all <p> tags
for p in ps:
    print(p.text)

# print the content of all <li> tags
for li in lis:
    print(li.text)

编程相关推荐

Java中的并发监视器和同步关键字
java试图删除学生，但不断出错
java JSONObject到文档
java在不使用Access Bean的情况下获取类中的属性值
安卓和windows phone之间的java共享数据库
java程序不断终止，我不知道为什么
java测量时间并不能证实LinkedList的优势
java InputStream从串行端口读取数据
Jersey 2.29中带有自定义注释的java注入方法参数
JAVA中的异常理解throw关键字

使用python beautifulsoup进行Web爬网

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用python beautifulsoup进行Web爬网

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >