2024-05-17 14:15:56 发布
网友
我使用pd.read_html()从网页导入表,但Python没有将数据结构化为数据帧,而是将其作为列表导入。如何将数据导入为数据帧?谢谢您!
pd.read_html()
代码如下:
import pandas as pd import html5lib url = 'http://www.fdic.gov/bank/individual/failed/banklist.html' dfs = pd.read_html(url) type(dfs) Out[1]: list
^{}生成一个数据帧列表(一个HTML源中可能有多个表),通过索引获得所需的表。在您的情况下,只有一个数据帧:
dfs = pd.read_html(url) df = dfs[0] print(df)
注意,如果HTML源代码中没有tables,它将返回一个错误,并且永远不会生成空列表。
table
import pandas as pd import html5lib url = 'http://www.fdic.gov/bank/individual/failed/banklist.html' dfs = pd.read_html(url) df = pd.concat(dfs) df
^{} 生成一个数据帧列表(一个HTML源中可能有多个表),通过索引获得所需的表。在您的情况下,只有一个数据帧:
注意,如果HTML源代码中没有
table
s,它将返回一个错误,并且永远不会生成空列表。相关问题 更多 >
编程相关推荐