正在分析不同的bs4。元素.标记带着美丽的面纱

2024-09-30 06:14:57 发布

男 | 程序猿一只，喜欢编程写python代码。

我想解析此url中的表并将其导出为csv：

如果我这样做：

sauce = urlopen(url_bank).read()
soup = bs.BeautifulSoup(sauce, 'html.parser')

然后这个：

^{pr2}$

除了最后一列“Códigos Isin”之外，所有元素都得到了很好的解析这是因为html代码有一个中断。我不知道怎么办，我试过这一部分，但还是不行：

lista_text = lista_text + [str(elements.string).replace('<br/>','')]

在那之后，我把名单拿到np.数组然后将其导出为.csv。那部分已经完成了，我只需要解决这个问题。在

提前谢谢！在

Tags： csv text http url es html www fi

1条回答

网友

1楼 · 发布于 2024-09-30 06:14:57

只是您需要注意^{}的作用-如果有多个子元素，它将返回None-就像{}一样：

If a tag contains more than one thing, then it’s not clear what .string should refer to, so .string is defined to be None

使用.get_text()代替：

for elements in resto:
    lista_text = lista_text + [elements.get_text(strip=True)]