这是我第一次来这里,所以请耐心等待。你知道吗
我正试图从我当地的新闻网站上搜刮(城市名称——格但斯克)中有这个词的所有链接。你知道吗
问题是,我收到了一些没有城市名称的链接。你知道吗
import requests
from fake_useragent import UserAgent
from bs4 import BeautifulSoup
import lxml
import re
url = 'http://www.trojmiasto.pl'
nazwa_pliku = 'testowyplik.txt'
user_agent = UserAgent()
strona = requests.get(url,headers={'user-agent':user_agent.chrome})
with open(nazwa_pliku,'w') as plik:
plik.write(page.content.decode('utf-8')) if type(page.content) == bytes else file.write(page.content)
def czytaj():
plikk = open('testowyplik.txt')
data = plikk.read()
plikk.close()
return data
soup = BeautifulSoup(czytaj(),'lxml')
linki = [li.div.a for div in soup.find_all('div',class_='entry-letter')]
for lin in linki:
print(lin)
rezultaty = soup.find_all('a',string=re.compile("Gdańsk"))
print(rezultaty)
l=[]
s=[]
for tag in rezultaty:
l.append(tag.get('href'))
s.append(tag.text)
for i in range(len(s)):
print('url = '+l[i])
print('\n')
可以使用contains运算符(*)尝试attribute=value
完整脚本
没有列表理解:
下面是Python 3中一个完整而简单的示例:
以下是上述代码的输出(为清晰起见,格式为Markdown):
相关问题 更多 >
编程相关推荐