有没有办法加快Pandas的活动？

def gen_fuzz_logic_signal(longp, shortp): # Input dataframes should have 0, -1, or 1 value flogic_signal = pd.DataFrame(index = longp.index, columns = longp.columns) for sym in longp.columns: print sym prev_enter = 0 for inum in range(0, len(longp.index)): cur_val = np.nan if longp.ix[inum, sym] == 0 and prev_enter == +1: cur_val = 0.5 if shortp.ix[inum, sym] == 0 and prev_enter == -1: cur_val = -0.5 if longp.ix[inum, sym] == 1 and shortp.ix[inum, sym] == -1: if longp.ix[inum - 1, sym] != 1: cur_val = 1 prev_enter = 1 elif shortp.ix[inum - 1, sym] != -1: cur_val = -1 prev_enter = -1 else: cur_val = prev_enter else: if longp.ix[inum, sym] == 1: cur_val = 1 prev_enter = 1 if shortp.ix[inum, sym] == -1: cur_val = -1 prev_enter = -1 flogic_signal.ix[inum, sym] = cur_val return flogic_signal

import time import numpy as np import pandas as pd def timef(func, *args): start= time.clock() for i in range(2): func(*args) end= time.clock() time_complete = (end-start)/float(2) print time_complete def tfunc(num_row, num_col): df = pd.DataFrame(index = np.arange(1,num_row), columns = np.arange(1,num_col)) for col in df.columns: for inum in range(1, len(df.index)): df.ix[inum, col] = 0 #np.nan return df timef(tfunc, 1000, 1000) <<< This takes 73 seconds on a Core i5 M460 2.53gz Windows 7 laptop.

def gen_fuzz_logic_signal3(longp, shortp): # Input dataframes should have 0 or 1 value flogic_signal = pd.DataFrame(index = longp.index, columns = longp.columns) for sym in longp.columns: coll = longp[sym].values cols = shortp[sym].values prev_enter = 0 newcol = [None] * len(coll) for inum in range(1, len(coll)): cur_val = np.nan if coll[inum] == 0 and prev_enter == +1: cur_val = 0.5 if cols[inum] == 0 and prev_enter == -1: cur_val = -0.5 if coll[inum] == 1 and cols[inum] == -1: if coll[inum -1] != 1: cur_val = 1 prev_enter = 1 elif cols[inum-1] != -1: cur_val = -1 prev_enter = -1 else: cur_val = prev_enter else: if coll[inum] == 1: cur_val = 1 prev_enter = 1 if cols[inum] == -1: cur_val = -1 prev_enter = -1 newcol[inum] = cur_val flogic_signal[sym] = newcol return flogic_signal

1条回答

网友

1楼 · 发布于 2024-09-26 04:42:16

我相信.ix的实现在0.11中确实发生了变化。（http://pandas.pydata.org/pandas-docs/stable/whatsnew.html）不确定它是否相关。在

我在0.10.1上得到的一个快速加速是将tfunc更改为below以缓存正在更新的列/系列

def tfunc(num_row, num_col):
   df = pd.DataFrame(index = np.arange(1,num_row), columns = np.arange(1,num_col))
   for col in df.columns:
       sdf = df[col]
       for inum in range(1, len(df.index)):
           sdf.ix[inum] = 0 #np.nan
   return df

在我的机器上从~80到~9

相关问题更多 >

编程相关推荐

热门问题

热门文章