以下是我的数据帧的前10列:
import pandas as pd
df = pd.DataFrame({
'0': [373.60],
'1': [442.83],
'2': [259.21],
'3': [293.05],
'4': [332.79],
'5': [360.03],
'6': [676.55],
'7': [481.67],
'8': [486.59],
'9': [561.65],
'10': [491.75]})
以此类推,实际上我的df包含100000列。最小值是109.59,最大值是1703.35
我想将df划分为长度为3.98的特定范围,然后定义一个包含最大值的ragne。 我的意思是,范围必须如下所示:
# converting df to array
df_array = np.array(df)
# defining ranges like:
range_length=3.98
range_1 = df_array.min() + range_length
range_2 = range_1 + range_lenght
...
range_n = df_array.max() - range_n-1
然后我看到一些范围_150包含大约1200个值,这是我需要的最常见的分布范围
我需要在df中定义该范围内每个值的索引
我真的不知道怎么做。看起来需要创建几个函数。有人能帮忙吗
这样,您可以获得每个范围的条目数:
这样,您可以获得点击次数最多的索引(范围):
您可以按如下方式获取此范围内的条目:
也许有帮助
相关问题 更多 >
编程相关推荐