Python,BeautifulSoup解析出一个T

2024-09-30 16:41:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我从我的Twitter时间轴的源代码中获取了一个HTML页面,如下所示:

http://pastebin.com/deefvbYw

这是我举个例子的一条Tweet。 我一辈子都不能让它合作。 我想让它显示:

德米特里@TheFPShow “我一直这样做。。。youtube.com/watch?v=DF9WP8…“

如果有人能给我一些建议的话。在


Tags: comhttp源代码youtubehtmltwitter页面例子
1条回答
网友
1楼 · 发布于 2024-09-30 16:41:29
soup = BeautifulSoup(twit)

name_tag = soup('strong', {'class': 'fullname js-action-profile-name show-popup-with-id'})
user = name_tag[0].contents[0]

action_tag = soup('span', {'class': 'username js-action-profile-name'})
at_sign = action_tag[0].contents[0].contents[0]
show_name = action_tag[0].contents[1].contents[0]

twit_text = soup('p', {'class': 'js-tweet-text'})
message = twit_text[0].contents[0]
url = twit_text[0].contents[1]['data-expanded-url']

print user, at_sign, show_name, message, url

输出:

^{pr2}$

相关问题 更多 >