我有一个这样的数据帧
time sym ask0 ask1 ask2 \
date
2017-08-21 07:00:00 07:00:00 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:00:15 07:00:15 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:00:30 07:00:30 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:00:45 07:00:45 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:01:00 07:01:00 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:01:15 07:01:15 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:01:30 07:01:30 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:01:45 07:01:45 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:02:00 07:02:00 b'7YR' 100.81250 100.828125 100.84375
2017-08-21 07:02:15 07:02:15 b'7YR' 100.81250 100.828125 100.84375
列ask0 ask1 ask2
都是float64
加法(+)乘法(*)和偶数整数除法(//)工作正常。例如
df['mid'] = (df['ask0'] + df['ask1'])*0.5
df['mid'] = (df['ask0'] + df['ask1'])//2
但是,如果我尝试除以float,我会得到这个错误
df['mid'] = (df['ask0'] + df['ask1'])/2
python: symbol lookup error: /opt/anaconda3/lib/python3.5/site-packages/numexpr/../../../libmkl_vml_mc3.so: undefined symbol: mkl_serv_getenv
更新: 我发现,如果我的系列少于10000行,那么我可以划分。但如果超过10000行,它就会崩溃。有人能证实吗?你知道吗
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0,100,size=(10500, 4)), columns=list('ABCD'))
print(df.head())
df['A'] = df['A']/5
我提出的解决方案是使用批划分方法。但我只想知道大熊猫是否真的只能将大小小于10000的df分开。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐