Unicode解析

from urllib.request import urlopen html = urlopen("http://www.google.com/").read().decode('utf-8').replace("preview","") from html.parser import HTMLParser class MyHTMLParser(HTMLParser): def handle_data(self, data): if any(c.isalpha() for c in data): print(data) MyHTMLParser().feed(html) input()

1条回答

网友

1楼 · 发布于 2024-04-19 11:52:15

看了之后：UnicodeEncodeError: 'charmap' codec can't encode - character maps to <undefined>, print function

按照建议2，解决方案似乎涉及导入sys并用系统标准输出编码和errors='ignore'

html = urlopen("http://www.google.com/").read().encode(sys.stdout.encoding, errors='replace').decode('utf-8')`

你可能需要再解码一次…我不太确定，因为我还没有在我的机器上设置这个问题

编程相关推荐

java如何在任何一个特定端口收到短信时自动打开Android应用程序？
Android/Java如何创建int数组
Android Java：启动活动时出现问题，错误导致类片段膨胀
Java方法来接收请求并生成Oauth签名
PDFBox中的java渐变笔划
java如何使用字符串从数组列表中获取数据
java如何让WebSphere项目在tc server下运行？
scala SPARK：java。lang.IllegalStateException:找不到任何生成目录
java如何找到集合类型？
java如何编写Firebase Firestore多对多关系的读取规则

相关问题更多 >

编程相关推荐

热门问题

热门文章

Unicode解析

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >