编码问题请求结果

2024-06-28 19:27:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我在学习python,我试图从维基百科检索数据,但给了我关于链接、文本等特殊字符的编码问题:

我的代码:

import sys
from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("https://pt.wikipedia.org/wiki/Jair_Bolsonaro")



bsObj = BeautifulSoup(html)

for link in bsObj.findAll("a"):
    if 'href' in link.attrs:
        print(link.attrs['href'])

结果:

/wiki/Hamilton_Mour%C3%A3o
/wiki/Michel_Temer
/wiki/C%C3%A2mara_dos_Deputados_do_Brasil
...

Should be:
    /wiki/Hamilton_Mourão
    /wiki/Michel_Temer
    /wiki/Câmara_dos_Deputados_do_Brasil
    ...

Tags: infromimporthtmlwikilinkattrsurlopen