Python（bs4+selenium）在使用selenium模拟某些操作后搜索html数据

driver = webdriver.Firefox() driver.get('https://www.ybpn.de/ihre-parfuemerien/') search_elem = driver.find_element_by_id("search_input") # Find search form search_elem.send_keys("80331") # Enter zip code - later based on a .txt of zip codes submit_button = driver.find_element_by_name("tx_ybpn_storefinder[submit]").submit() # press "submit" button, search

2条回答

网友

1楼 · 编辑于 2024-09-28 12:15:57

要获取特定邮政编码的联系人，可以使用以下示例：

import requests
from bs4 import BeautifulSoup


url = 'https://www.ybpn.de/ihre-parfuemerien/'
data = {'tx_ybpn_storefinder[searchReq][term]': '80331'}

soup = BeautifulSoup(requests.get(url).content, 'html.parser')
data['tx_ybpn_storefinder[__trustedProperties]'] = soup.select_one('#storefinder [name*=__trustedProperties]')['value']
soup = BeautifulSoup(requests.post(url, data=data).content, 'html.parser')

for item in soup.select('.storefinder__list-item'):
    print(item.select_one('.storefinder-item__title').get_text(strip=True))
    print(item.select_one('.storefinder-item__adress').get_text(strip=True, separator='\n'))
    print(item.select_one('.storefinder-item__contact').get_text(strip=True))
    print('-' * 80)

印刷品：

Parfümerie Brückner
Rindermarkt 1
80331
München
Tel.:+49 89 263181
                                        
Parfümerie Brückner
Marienplatz 8
80331
München
Tel.:+49 89 223874
                                        
City Parfümerie Rathjen
Tal 14
80331
München
Tel.:+49 89 2285222
                                        
Die kleine Theatiner Parfümerie
Theatiner Straße 35
80333
München
Tel.:+49 89 267919
                                        
City Parfümerie Rathjen
Stachus Passagen Karlsplatz 1. UG
80335
München
Tel.:+49 89 55 4009
                                        

...and so on.

网友

2楼 · 编辑于 2024-09-28 12:15:57

我有一个基于公认答案的想法，那就是获取整个身体的内部HTML

    driver = webdriver.Firefox()
    driver.get('https://www.ybpn.de/ihre-parfuemerien/')
    
    search_elem = driver.find_element_by_id("search_input") # Find search form
    search_elem.send_keys("80331") # Enter zip code - later based on a .txt of zip codes
    submit_button = driver.find_element_by_name("tx_ybpn_storefinder[submit]").submit() # press "submit" button, search

soup = BeautifulSoup(page.find_element_by_tag_name("body").get_attribute('innerHTML'), features="html.parser")
for item in soup.select('.storefinder__list-item'):
    print(item.select_one('.storefinder-item__title').get_text(strip=True))
    print(item.select_one('.storefinder-item__adress').get_text(strip=True, separator='\n'))
    print(item.select_one('.storefinder-item__contact').get_text(strip=True))
    print('-' * 80)

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python（bs4+selenium）在使用selenium模拟某些操作后搜索html数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >