假设我有以下Excel文件:
A B C
0 - - -
1 Start - -
2 3 2 4
3 7 8 4
4 11 2 17
我想在数据框中读取文件,确保我开始在Start
值所在的行下面读取它。
注意:该Start
值并不总是位于同一行,因此如果要使用:
import pandas as pd
xls = pd.ExcelFile('C:\Users\MyFolder\MyFile.xlsx')
df = xls.parse('Sheet1', skiprows=4, index_col=None)
这将失败,因为skiprows
需要修复。是否有任何解决方法来确保xls.parse
找到字符串值而不是行号?
您可以使用
pd.read_excel('C:\Users\MyFolder\MyFile.xlsx', sheetname='Sheet1')
,因为它忽略空的excel单元格。然后,您的数据帧应如下所示:
然后使用
得到
This应答有助于找到df中“start”的位置
开始划船后,你可以使用熊猫的子帧
如果不需要包含“start”的行,只需将行从1开始
相关问题 更多 >
编程相关推荐