Python:beauthoulsoup的输出有错误的编码

def formTest (browser, formUrl, cardName, edition): browser.open (formUrl) data = browser.response().read() with open ('analyze.txt', 'wb') as textFile: print 'wrinting file' textFile.write (data) #BS4 -> need from_encoding soup = BeautifulSoup (data, from_encoding = 'latin-1') soup = soup.encode ('latin-1').decode('utf-8') table = soup.find('table', { "class" : "MKMTable specimenTable"})

1条回答

网友

1楼 · 发布于 2024-10-03 13:21:54

您现在可能不需要解决方案，但如果有人在这里停留，您应该这样做：
您可能应该对data而不是soup使用编码过程。
我通常要做的是使用requests库来获得原始响应，然后使用'response.text'这样的语法获取文本内容，然后使用response.encoding='utf-8'强制编码。
至少，我给响应.text到BeautifulSoup()

编程相关推荐

java调整可绘图问题的大小（引用未被传递？）
如何在java 安卓中对数字进行排序？
方法中的java布尔值未正确返回（数组形式参数）
JavaEclipseMilo：如何读取历史数据？
java重写toString（）时出现错误
java如何调试运行在两个不同Tomcat服务器上的两个应用程序？
如何将java应用程序中的对象序列化为多个文件？
macos MacOSX系统菜单名w/Java？
java动态配置Maven依赖项
java Android Studio：如何找到Gradle的安装位置？

相关问题更多 >

编程相关推荐

热门问题

热门文章