计算每个唯一ID的行驶距离总和问题的回答

计算每个唯一ID的行驶距离总和

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一个数据框，它有三列。一列包含x坐标，另一列包含y坐标。此外，如您所见，还有一个“trackid”列——该列将所有x和y坐标与特定的、唯一的trackid相关联 <pre><code> trackiD X_COORDINATES Y_COORDINATES 2 542.299805 23.388090 2 544.108215 23.575758 2 545.300598 23.962421 2 546.417053 25.049328 2 546.198669 24.830357 2 546.724915 24.916084 2 547.037048 24.918982 2 547.011963 24.785202 2 547.649231 24.845772 3 547.600525 24.613401 3 547.891479 24.268734 3 548.580505 24.459103 3 548.144409 23.915531 3 548.626770 23.922005 4 548.527222 24.134670 4 548.504211 23.642254 4 548.936584 24.028818 4 548.627869 23.295454 </code></pre> 我想做的是： <ul> <li>取每对x和y坐标，并使用毕达哥拉斯距离公式计算它们之间移动距离的增量：（sqrt（x2-x1）^2+（y2-y1）^2），将每个距离增量添加到列表中，然后计算列表中所有增量的总和，以获得移动的总距离——同样需要注意的是，我仅对唯一trackid内的每组坐标进行此计算。即，计算trackid 2的距离增量之和，然后分别对trackid 3和4执行相同的过程，以此类推——最终将每个唯一的track ID的所有行驶总距离存储在一个新列表中</李> </ul> 这是我当前的代码——它运行，但问题是，它输出的列表中只有一个较大的可能不正确的值（如下所示）。此外，在stackoverflow上，“value”变量似乎已被截断并跨多行显示，但我在jupyter笔记本中运行它时并非如此 <pre><code> def pythag_dis(U_id): c = data.Unique_id == U_id df = data[c] df.reset_index(inplace = True) k = sorted(df.trackId.unique()) i = 0 j = 1 length = len(k) while i < length: condition = df.trackId == k[i] df2 = df[condition] df2.reset_index(inplace = True) value = math.sqrt((df.Object_Center_0.iloc[j] - df.Object_Center_0.iloc[i])**2 + (df.Object_Center_1.iloc[j] - df.Object_Center_1.iloc[i])**2) mylist = [] mylist.append(value) fulldistance = sum(mylist) mylist2 = [] mylist2.append(fulldistance) i+=1 return mylist2 pythag_dis('1CCM0701') </code></pre> <pre><code>OUTPUT: [1976.075585650214] </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

首先创建两个新列<code>X_SHIFTED</code>和<code>Y_SHIFTED</code>，它们代表每个轨迹ID的下一点坐标。我们通过组合<code>df.groupby</code>和<code>df.shift</code>来实现这一点： <pre><code>df[['X_SHIFTED', 'Y_SHIFTED']] = df.groupby('trackiD').shift() </code></pre> 然后，简单地使用点（<code>X_COORDINATES</code>，<code>Y_COORDINATES</code>）和（<code>X_SHIFTED</code>，<code>Y_SHIFTED</code>）之间的欧几里德距离公式。我们可以使用<code>df.apply</code>行方式（<code>axis=1</code>）以及<code>math.dist</code>来实现这一点： <pre><code>import math df['DIST'] = df.apply( lambda row: math.dist( (row['X_COORDINATES'], row['Y_COORDINATES']), (row['X_SHIFTED'], row['Y_SHIFTED']) ), axis=1) </code></pre> 输出： <pre><code> trackiD X_COORDINATES Y_COORDINATES X_SHIFTED Y_SHIFTED DIST 0 2 542.299805 23.388090 NaN NaN NaN 1 2 544.108215 23.575758 542.299805 23.388090 1.818122 2 2 545.300598 23.962421 544.108215 23.575758 1.253509 3 2 546.417053 25.049328 545.300598 23.962421 1.558152 4 2 546.198669 24.830357 546.417053 25.049328 0.309257 5 2 546.724915 24.916084 546.198669 24.830357 0.533183 6 2 547.037048 24.918982 546.724915 24.916084 0.312146 7 2 547.011963 24.785202 547.037048 24.918982 0.136112 8 2 547.649231 24.845772 547.011963 24.785202 0.640140 9 3 547.600525 24.613401 NaN NaN NaN 10 3 547.891479 24.268734 547.600525 24.613401 0.451054 11 3 548.580505 24.459103 547.891479 24.268734 0.714841 12 3 548.144409 23.915531 548.580505 24.459103 0.696886 13 3 548.626770 23.922005 548.144409 23.915531 0.482404 14 4 548.527222 24.134670 NaN NaN NaN 15 4 548.504211 23.642254 548.527222 24.134670 0.492953 16 4 548.936584 24.028818 548.504211 23.642254 0.579981 17 4 548.627869 23.295454 548.936584 24.028818 0.795693 </code></pre> 要获取每条轨迹的距离总和，可以使用： <pre><code>df.groupby('trackiD')['DIST'].sum() </code></pre> 输出： <pre><code>trackiD 2 6.560621 3 2.345185 4 1.868628 Name: DIST, dtype: float64 </code></pre>

计算每个唯一ID的行驶距离总和

1 个回答

相关Python问题