数据帧中Pandas的累积时间序列范围

Order starttime endtime RollingStart RollingEnd 1 2015-07-01 10:24:43.047 2015-07-01 10:24:43.150 2015-07-01 10:24:43.047 2015-07-01 10:24:43.150 1 2015-07-01 10:24:43.137 2015-07-01 10:24:43.200 2015-07-01 10:24:43.047 2015-07-01 10:24:43.200 1 2015-07-01 10:24:43.197 2015-07-01 10:24:57.257 2015-07-01 10:24:43.047 2015-07-01 10:24:57.257 1 2015-07-01 10:24:57.465 2015-07-01 10:25:13.470 2015-07-01 10:24:57.465 2015-07-01 10:25:13.470 1 2015-07-01 10:24:57.730 2015-07-01 10:25:13.485 2015-07-01 10:24:57.465 2015-07-01 10:25:13.485 2 2015-07-01 10:48:57.465 2015-07-01 10:48:13.485 2015-07-01 10:48:57.465 2015-07-01 10:48:13.485

from io import StringIO import io text = """Order starttime endtime 1 2015-07-01 10:24:43.047 2015-07-01 10:24:43.150 1 2015-07-01 10:24:43.137 2015-07-01 10:24:43.200 1 2015-07-01 10:24:43.197 2015-07-01 10:24:57.257 1 2015-07-01 10:24:57.465 2015-07-01 10:25:13.470 1 2015-07-01 10:24:57.730 2015-07-01 10:25:13.485 2 2015-07-01 10:48:57.465 2015-07-01 10:48:13.485""" df = pd.read_csv(StringIO(text), sep='\s{2,}', engine='python', parse_dates=[1, 2]) df['RollingStart'] = np.where((df['endtime'] >= df['RollingStart'].shift()) & (df['RollingEnd'].shift()>= df['start']), min(df['starttime'],df['RollingStart']),df['starttime']) df = pd.read_csv(StringIO(text), sep='\s{2,}', engine='python', parse_dates=[1, 2]) df['RollingStart']=df['starttime'] df['RollingEnd']=df['endtime'] df['RollingStart'] = np.where((df['endtime'] >= df['RollingStart'].shift()) & (df['RollingEnd'].shift()>= df['starttime']),min(df['starttime'],df['RollingStart']),df['starttime'])

Traceback (most recent call last): File "<stdin>", line 2, in <module> File "C:\Anaconda3\lib\site-packages\pandas\core\generic.py", line 731, in __nonzero__ .format(self.__class__.__name__)) ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

2条回答

网友

1楼 · 编辑于 2024-06-25 23:56:18

试试这个：

版本1

NaT = pd.NaT
df['Rolling2']     = np.where(df['starttime'].shift(-1) > df['endtime'], NaT,'drop')
df['Rolling2']     = df['Rolling2'].shift(1)
df['RollingStart'] = np.where(df['Rolling2']  =='drop',None,df['starttime'])
df['RollingStart'] = pd.to_datetime(df['RollingStart']).ffill()
df['RollingEnd']   = df['endtime']
del df['Rolling2']

版本2。在

^{pr2}$

网友

2楼 · 编辑于 2024-06-25 23:56:18

看起来您试图根据尚未设置的值返回值

df['start'] =...conditions... df['start'].shift()

在我看来，你想给一个熊猫一无所知的专栏设置一个条件。在

如果您只是尝试将“start”值设置为这些列中的最新时间，请尝试使用或语句构建语句，或者创建一个临时数组并使用max（如果您只是试图获取最新时间）

df['start'] = np.where(max(df['enddatetime'],df['startdatetime'],))

如果上面的方法是错误的，你有没有代码来复制这个df，这样我就可以看到是否有同样的错误？在

相关问题更多 >

编程相关推荐

热门问题

热门文章