pandas列名字符串操作

df = pd.DataFrame( [[1, 3, 5], [2, 4, 6]], columns=['Base + Trial Spot Price(X220) Settle Price S=1 [1.00] 1932', 'Base + Trial Spot Price(Y220) Settle Price S=1 [1.00] 2012', 'Base + Trial Spot Price(Y220) Settle Price S=1 [1.00] 2015'])

2条回答

网友

1楼 · 编辑于 2024-10-02 10:21:18

您可以从extract column数据创建元组并将其传递给函数pd.MultiIndex.from_tuples()这将生成列，然后您可以重新创建dataframe。请在下面找到代码。在

import pandas as pd
import numpy as np

pd.set_option('display.multi_sparse', False)

values = [[1, 3, 5], [2, 4, 6]]
df = pd.DataFrame(values,columns=['Base + Trial Spot Price(X220) Settle Price S=1 [1.00] 1932', 'Base + Trial Spot Price(Y220) Settle Price S=1 [1.00] 2012', 'Base + Trial Spot Price(Y220) Settle Price S=1 [1.00] 2015'])


cols = pd.MultiIndex.from_tuples([(df.columns[0][24:28], df.columns[0][54:]), (df.columns[1][24:28], df.columns[0][54:]), (df.columns[2][24:28], df.columns[0][54:])])
pd.DataFrame(values, columns=cols)

输出：

^{pr2}$

行pd.set_option('display.multi_sparse', False)用于将多轴配置为具有重复的列名。在

参考文献：

MultiIndex / Advanced Indexing — pandas documentation

网友

2楼 · 编辑于 2024-10-02 10:21:18

你可以用str.提取物为列名提取所需的值，然后multiindex.from元组用于创建多索引

df.columns = df.columns.str.extract('.*?\((.*)\).*?(\d{4})', expand=True)
df.columns = pd.MultiIndex.from_tuples(df.columns)

你得到了

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章