用urllib抓取网页

2024-09-30 20:22:25 发布

您现在位置：Python中文网/ 问答频道 /正文

9835

网友

男 | 程序猿一只，喜欢编程写python代码。

我试图做一些简单的网页抓取，我一直得到这个错误，我不知道哪里出了问题，因为我对python相当陌生

异常：需要类似于字节的对象，而不是“str”

import time
import urllib.request
import urllib.parse


stock = 'a'


def finvizKeyStats(stock):
    try:
        sourceCode = urllib.request.urlopen('http://finviz.com/quote.ashx?t='+stock).read()
        pbr = sourceCode.split('P/B</td><td width="8%" class="snapshot-td2" align="left"><b>')[1].split('</b></td>')[0]
        print(pbr)
    except Exception as e:
        print('Exception:', e)

finvizKeyStats('a')

Tags： import 网页字节 request 错误 stock exception urllib

2条回答

网友

1楼 · 编辑于 2024-09-30 20:22:25

首先必须将二进制对象解码为字符串

sourceCodeString = sourceCode.decode()

我建议你使用urllib2和BeautifulSoup在网上有很多关于用beauthoulsoup抓取网页的教程。在

网友

2楼 · 编辑于 2024-09-30 20:22:25

您需要将二进制对象解码为字符串：

sourceCodeString = sourceCode.decode()

用urllib抓取网页

相关问题更多 >

编程相关推荐

热门问题

热门文章

用urllib抓取网页

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >