HTMLParser流式处理可以在python中使用urllib2实现吗

class Parser(HTMLParser.HTMLParser): ... parser=Parser() httpRequest = urllib2.Request("http://www......") pageContent = urllib2.urlopen(httpRequest) while (True): htmlTextPortion = pageContent.read() parser.feed(htmlTextPortion)

1条回答

网友

1楼 · 发布于 2024-09-24 16:35:57

urllib2的默认处理程序实际上似乎是在urlopen()调用中获取整个页面。read()不阻止，因为整个页面已经可用。您可能可以编写自己的处理程序来流式处理数据（opener返回一个类似文件的对象，它通过响应上的read()公开，这可以是流式的），但是如果另一个库已经有了该功能，我会改为使用它。在

编程相关推荐

继承如何将这个Java接口和继承结构转换为Golang？
java set callout image mapbox 安卓
java无法访问Android Studio中的XML表单主活动
java将结果集中的varchar放入ArrayList
java应用程序引发所有访问的facebook OAuth异常
java如何使用TestNG在两个不同的浏览器中并行运行两个测试方法？
java操作栏上下文菜单
java Javafx将标签绑定到StringProperty的位置
java如何正确初始化JNA中“Structure”中的数组字段？
如何通过读取Java中的URL来知道图像是否存在？

相关问题更多 >

编程相关推荐

热门问题

热门文章

HTMLParser流式处理可以在python中使用urllib2实现吗

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >