从一点开始的多行中保留一行问题的回答

从一点开始的多行中保留一行

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

我认为基于熊猫编写解决方案更容易。原因是： <ul> <li>我可以使用列名（代码可读性更好）</li> <li>PandasAPI功能更强大，尽管它的工作速度比“pure”Numpy慢</李> </ul> 进行如下工作： <ol> <li>将var转换为数据帧： <pre><code> lines = pd.DataFrame(var.reshape(10,4), columns=pd.MultiIndex.from_product( (['P1', 'P2'], ['x','y']))) </code></pre> 行的初始部分为： <pre><code> P1 P2 x y x y 0 551 752 541 730 1 548 738 723 548 2 285 682 226 676 3 416 679 345 678 </code></pre> </li> <li>计算每条线长度的平方： <pre><code> lines[('', 'lgth')] = (lines[('P1', 'x')] - lines[('P2', 'x')]) ** 2\ + (lines[('P1', 'y')] - lines[('P2', 'y')]) ** 2 lines.columns = lines.columns.droplevel() </code></pre> 我故意在长度为的正方形处“停止”，因为它是足够比较长度（计算根不会改变比较结果） 还要注意的是，需要列上的第一级多索引只是为了更容易地表达感兴趣的列。此外，他们将不需要，所以我把它扔了 这次我把行的全部内容放到： <pre><code> x y x y lgth 0 551 752 541 730 584 1 548 738 723 548 66725 2 285 682 226 676 3517 3 416 679 345 678 5042 4 345 678 388 674 1865 5 249 679 226 676 538 6 270 678 388 674 13940 7 472 650 751 473 109170 8 751 473 716 561 8969 9 731 529 751 473 3536 </code></pre> </li> <li>下一步是计算点数据帧，其中所有点（开始和结束每行的末尾）以及（平方）的长度位于相同的列中对应的行： <pre><code> points = pd.concat([lines.iloc[:,[0, 1, 4]], lines.iloc[:,[2, 3, 4]]], keys=['P1', 'P2'])\ .sort_values(['x', 'y', 'lgth']).reset_index(level=1) </code></pre> 现在，我使用iloc来指定列（第一次用于起始点）第二个是终点）。为了更容易阅读这个数据帧，我传递了键，以包含“origin” 然后我对行进行排序 内容是: <pre><code> level_1 x y lgth P2 5 226 676 538 P2 2 226 676 3517 P1 5 249 679 538 P1 6 270 678 13940 P1 2 285 682 3517 P1 4 345 678 1865 P2 3 345 678 5042 P2 4 388 674 1865 P2 6 388 674 13940 P1 3 416 679 5042 P1 7 472 650 109170 P2 0 541 730 584 P1 1 548 738 66725 P1 0 551 752 584 P2 8 716 561 8969 P2 1 723 548 66725 P1 9 731 529 3536 P2 9 751 473 3536 P1 8 751 473 8969 P2 7 751 473 109170 </code></pre> 注意，例如，点226676出现两次。第一次发生的时候直线5和第二直线2（直线var和直线中的指数） </li> <li>要查找要删除的行的索引，请运行： <pre><code> toDrop = points[points.duplicated(subset=['x', 'y'])]\ .level_1.reset_index(drop=True); </code></pre> 为了更容易理解这段代码是如何工作的，请一步一步地运行它检查每个步骤的结果 结果是： <pre><code> 0 2 1 3 2 6 3 8 4 7 Name: level_1, dtype: int64 </code></pre> 请注意，上面的左列只是索引（这无关紧要）。真正的信息在右边的列（值）中 </li> <li>要显示应保留的行，请运行： <pre><code> result = lines.drop(toDrop) </code></pre> 获取： <pre><code> x y x y lgth 0 551 752 541 730 584 1 548 738 723 548 66725 4 345 678 388 674 1865 5 249 679 226 676 538 9 731 529 751 473 3536 </code></pre> 上述结果不包含，例如： <ul> <li>直线2，当点226时，676出现在直线5中</li> <li>线3，当点345时，678出现在线4中</li> </ul> 只有这些行（2和3）被删除，因为它们是比第二条提到的两条线都长（参见前面的部分结果） </li> </ol> 也许这就足够了，或者如果您需要从 var（原始的Numpy数组），并将结果保存到另一个数组中变量，运行： <pre><code>var2 = np.delete(var, toDrop, axis=0) </code></pre>

从一点开始的多行中保留一行

1 个回答

相关Python问题