正在分析不同的bs4。元素.标记带着美丽的面纱

2024-09-30 06:14:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我想解析此url中的表并将其导出为csv:

http://www.bde.es/webbde/es/estadis/fi/ifs_es.html

如果我这样做:

sauce = urlopen(url_bank).read()
soup = bs.BeautifulSoup(sauce, 'html.parser')

然后这个:

^{pr2}$

除了最后一列“Códigos Isin”之外,所有元素都得到了很好的解析 这是因为html代码有一个中断。我不知道 怎么办,我试过这一部分,但还是不行:

lista_text = lista_text + [str(elements.string).replace('<br/>','')]

在那之后,我把名单拿到np.数组然后将其导出为.csv。那部分已经完成了,我只需要解决这个问题。在

提前谢谢!在


Tags: csvtexthttpurleshtmlwwwfi
1条回答
网友
1楼 · 发布于 2024-09-30 06:14:57

只是您需要注意^{}的作用-如果有多个子元素,它将返回None-就像{}一样:

If a tag contains more than one thing, then it’s not clear what .string should refer to, so .string is defined to be None

使用.get_text()代替:

for elements in resto:
    lista_text = lista_text + [elements.get_text(strip=True)]

相关问题 更多 >

    热门问题