Python:Pandas:加速Apply函数

data4=pd.read_csv('check2.csv', parse_dates=['dater1','dater2'], infer_datetime_format=True) def nextweekday(date): day=date.weekday() if day==4: return date+datetime.timedelta(days=3) if day==5: return date+datetime.timedelta(days=2) else: return date+datetime.timedelta(days=1) def getquote(tick,date,plus): date=date+datetime.timedelta(days=plus) nextday=nextweekday(date) try: return DataReader(tick, "yahoo",date, nextday)["Close"] except: return "NO" def apply_days5(row): return getquote(row['AcquirorTickerSymbol'],row['dater2'],5) data4['days5']=data4.apply(apply_days5, axis=1)

1条回答

网友

1楼 · 发布于 2024-09-30 20:18:15

我不是百分之百确定你要达到什么目的，但有一些想法。在

首先，像这样反复攻击雅虎会增加很多不必要的开销。我可能会这样做，把所有股票数据读入一个数据帧。在

In [83]: tickers = data4['AcquirorTickerSymbol'].unique()

In [84]: min_date = data4['dater2'].min()
    ...: max_date = data4['dater2'].max()
    ...:     
    ...: dfs = []
    ...: for ticker in tickers:
    ...:     df = DataReader(ticker, 'yahoo', min_date, max_date)[['Close']]
    ...:     df['AcquirorTickerSymbol'] = ticker
    ...:     df['dater2'] = df.index
    ...:     dfs.append(df)

In [85]: stock_df = pd.concat(dfs, ignore_index=True)

然后，不使用apply，您可以将现有数据与stock df进行合并，如下所示：

^{pr2}$

如果您想填充缺少的值，而不是在apply中使用自定义逻辑，那么使用fillna会更快

In [94]: data4['Close'] = data4['Close'].fillna('NO')

相关问题更多 >

编程相关推荐

热门问题

热门文章