从url到文本fi的Python日志记录

import logging, logging.handlers logger = logging.getLogger('Radio Station') logger.setLevel(logging.INFO) fh = logging.FileHandler('thread.log') fh.setLevel(logging.INFO) formatter = logging.Formatter("%(asctime)s - %(name)s - %(levelname)s - %(message)s") fh.setFormatter(formatter) logger.addHandler(fh) host = 'localhost:8000' url = 'www.radio.nolife-radio.com:8000/played.html' http_handler = logging.handlers.HTTPHandler(host, url, method='GET') logger.addHandler(http_handler) logger.info("")

1条回答

网友

1楼 · 发布于 2024-10-01 00:32:38

好的，这里有一个简单的例子urllib，在Windows上应该很好，您将不得不解决如何处理您得到的HTML的问题（我建议您使用Beautiful Soup模块来解析HTML）。在

from urllib import FancyURLopener

page_url = "http://radio.nolife-radio.com:8000/played.html"

class myUrlOpener( FancyURLopener ):
    version = "Mozilla/5.0 (Windows; U; Windows NT 5.1; it; rv:1.8.1.11) Gecko/20071127 Firefox/2.0.0.11"

opener = myUrlOpener()

page_contents = opener.open( page_url ).read()

print page_contents

这可能比您在internet上找到的基本示例要复杂一些，因为这个站点似乎不接受来自pythonurllib用户代理的请求。在这里，通过调用FancyURLopener，我们可以将用户代理设置为Windows上的Firefox代理。在

检查该站点的（nolife-广播网）关于从页面中删除内容的政策。

相关问题更多 >

编程相关推荐

热门问题

热门文章