通过重新索引将行插入数据帧

import pandas as pd import numpy as np A1 = pd.read_table('Test data.tsv', encoding='ISO-8859-1', header = 2) A1.columns = ['time',2,3,4,5,6,7,'freq',9,10,11,12,13,'temp',15,16,17,18,19] A1truncated = A1[A1.temp >= 25]; A1truncated=A1truncated[A1truncated.temp <= 350.1] A1averaged = A1truncated.groupby(['temp'], as_index=False)['freq'].mean() A1averaged = np.around(A1averaged, decimals=1) A1averaged.set_index('temp') new_index = pd.Index(np.arange(25, 350, 0.1), name='temp') A1indexed = A1averaged.set_index('temp').reindex(new_index).reset_index()

1条回答

网友

1楼 · 发布于 2024-10-01 02:18:19

带浮点的索引可能有问题，不一致可能是因为浮点精度。所以我用littlehack-Int64Index代替了Float64Index。你知道吗

我试着用更简单的方法设置子集：

A1truncated = A1[(A1.temp >= 25) & ( A1.temp <= 350.1)]

然后省略第一组索引，因为它设置了两次：

A1averaged.set_index('temp')

将new_index设置为Int64Index：

new_index = pd.Index(np.arange(250, 3500), name='temp')

使用Int64Index乘列temp乘10，最后一列除以10。你知道吗

A1averaged['temp'] = A1averaged['temp'] * 10
A1indexed['temp'] = A1indexed['temp'] / 10

总之：

import pandas as pd 
import numpy as np           
A1 = pd.read_table('Test data.tsv', encoding='ISO-8859-1', header = 2) 

A1.columns = ['time',2,3,4,5,6,7,'freq',9,10,11,12,13,'temp',15,16,17,18,19] 

A1truncated = A1[(A1.temp >= 25) & ( A1.temp <= 350.1)]

A1averaged = A1truncated.groupby(['temp'], as_index=False)['freq'].mean() 
A1averaged = np.around(A1averaged, decimals=1)
new_index = pd.Index(np.arange(250, 3500), name='temp')

A1averaged['temp'] = A1averaged['temp'] * 10
A1indexed = A1averaged.set_index('temp').reindex(new_index).reset_index()
A1indexed['temp'] = A1indexed['temp'] / 10
print A1indexed.tail()
#       temp       freq
#3245  349.5  5830065.6
#3246  349.6  5830043.5
#3247  349.7  5830046.3
#3248  349.8  5830025.3
#3249  349.9  5830015.6

相关问题更多 >

编程相关推荐

热门问题

热门文章