使用Python利用网页功能

from BeautifulSoup import BeautifulSoup import json urlstr = 'http://www.sandracires.com/en/client/youtube/comments.php?v=' + videoId + '&page=' + str(npage) url = urllib2.urlopen(urlstr) content = url.read() soup = BeautifulSoup(content) #parse json newDictionary=json.loads(str(soup)) #print example print newDictionary['list'][1]['username']

1条回答

网友

1楼 · 发布于 2024-09-26 18:08:08

可能使用Google Youtube data API。请注意，（目前）只能使用API版本2检索注释-该版本已被弃用。显然在V3中还没有支持。Python客户端库可用，请参见https://developers.google.com/youtube/code#Python。

响应已经是JSON，不需要BS。web服务器似乎需要cookies，因此我建议使用^{}，特别是它的会话管理：

import requests

videoId = 'ZSzeFFsKEt4'
results = []
npage = 1
session = requests.session()
while True:
    urlstr = 'http://www.sandracires.com/en/client/youtube/comments.php'
    print "Getting page ", npage
    response = session.get(urlstr, params={'v': videoId, 'page': npage})
    content = response.json()
    if len(content['list']) > 1:
        results.append(content)
    else:
        break
    npage += 1

print results

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Python利用网页功能

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >