我试图让我的程序收集和打印的标题,从一个网站上的事件。我的代码的问题是,它打印的内容多于事件的标题。它还提供了超链接。如何删除超链接?你知道吗
from urllib.request import urlopen
from bs4 import BeautifulSoup
url_toscrape = "https://www.ntu.edu.sg/events/Pages/default.aspx"
response = urllib.request.urlopen(url_toscrape)
info_type = response.info()
responseData = response.read()
soup = BeautifulSoup(responseData, 'lxml')
events_absAll = soup.find_all("div",{"class": "ntu_event_summary_title_first"})
for events in events_absAll:
if len(events.text) > 0:
print(events.text.strip())
print(events_absAll)
另外,如何让for循环不断重复,以便获得完整的事件列表,如下面的列表?你知道吗
-7th ASEF Rectors' Conference and Students' Forum (ARC7)
-Be a Youth Corps Leader
-NIE Visiting Artist Programme January 2019
- Exercise Classes for You: Healthy Campus@NTU
-[eLearning Course] Information & Media Literacy (From January 2019)
先谢谢你
可以使用带有
^
(start with)操作符的attribute=value选择器来定位每个标题的class属性的开始部分非常感谢你帮助我。我现在有另一个问题。我正在收集活动的日期、时间和地点。他们很成功地出版了,但它对读者并不友好。如何使日期、时间和地点分别显示为:
我本来想分手的,但结果却有了很多,这让我看起来更难看。我想剥离我的正则表达式,但它似乎没有做任何事情。有什么建议吗?你知道吗
继续评论:
或(更好):
使用类
ntu_event_detail
并查找其中的a
:输出: 你知道吗
编辑: 更好的方法是创建
list
,将结果存储在其中,过滤空字符串(如果有的话):相关问题 更多 >
编程相关推荐