我的数据如下所示:
Source Target Value
1 Charlie Mac 0.6530945
2 Dennis Fank 0.7296234
3 Charlie Frank 0.4750875
4 Mac Dennis 0.3961787
5 Charlie Dennis 0.6213751
6 Mac Frank 0.9727454
7 Frank Charlie 0.4750875
8 Mac Charlie 0.6530945
9 Frank Mac 0.9727454
10 Frank Dennis 0.7296234
11 Dennis Mac 0.3961787
12 Dennis Charlie 0.6213751
我有两列名称,第三列给出一个关系值。所以第1行和第8行基本相同,第2行和第10行基本相同,所以名称的顺序(source,target)无关紧要。我想做的是去掉这些不需要的行,得到这样的结果:
Source Target Value
1 Charlie Mac 0.6530945
2 Dennis Fank 0.7296234
3 Charlie Frank 0.4750875
4 Mac Dennis 0.3961787
5 Charlie Dennis 0.6213751
6 Mac Frank 0.9727454
显然,在这个简单的示例中,我可以只返回前六行,但是我的数据集太大了。我不能只返回“Value”列中唯一的项,因为一些不相关的行可能具有相同的值。你知道吗
相关问题 更多 >
编程相关推荐