美丽的汤，Python和瑞典字符奥ÄÖ

1条回答

网友

1楼 · 发布于 2024-09-29 22:40:29

使用# coding: utf-8 时，只指定源代码文档的编码。您正在解析的页面可能声明了错误的编码（或者根本没有），因此BeautifulSoup失败了。在构建soup时尝试指定编码。下面是一个小例子：

markup = '''
<html>
    <head>
        <title>Övriga fakta</title>
        <meta charset="latin-1" />
    </head>
    <body>
        <h1>Öhman Företagsobligationsfond</h1>
        <p>Detta är en svensk sida.</p>
    </body>
</html>
'''

soup = BeautifulSoup(markup)
print soup.find('h1')

try:
    # Version 4
    soup = BeautifulSoup(markup, from_encoding='utf-8')
except TypeError:
    # Version 3
    soup = BeautifulSoup(markup, fromEncoding='utf-8')

print soup.find('h1')

结果是：

^{pr2}$

在Beautiful Soup 4中，参数是from_encoding，而在版本3中，参数是fromEncoding。在

编程相关推荐

CXF中的java格式XML输出？
java如何通过添加支持来解决问题：设计？
java Android Studio，无主活动设置页面
java Android发送HTTP请求，并在按钮上单击AsyncTask |委托问题
java Apache Config setProperty方法是在内存中写入还是重写旧配置？
java快速排序选择策略如何影响快速排序的总体Bigoh行为？
为什么我能够在Android/JAVA应用程序上使用字节打印条形码EAN13而不是条形码ITF？
在Internet Explorer中创建VM后加载Java小程序时出现问题
JAVAlang.ClassNotFoundException:sun。jdbc。odbc。JdbcOdbcDriver错误
java设计Servlet页面重定向系统

相关问题更多 >

编程相关推荐

热门问题

热门文章

美丽的汤，Python和瑞典字符奥ÄÖ

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >