Python中文
首页
教程
问答
标签
搜索
登录
注册
从两个不同的数据帧计算两个字符串列之间的Levenshtein距离
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有两个数据帧,它们包含相同的字符串列(主机名),我想计算两个数据帧之间所有可能的主机名对组合之间的Levenshtein距离,并将结果放入第三个数据帧中,在第三个数据帧中,我保留了每个可能组合的距离,但也保留了该组合的两个索引。在</p> <p>例如,假设我有两个数据帧:</p> <pre><code>Index Hostname 85608 dlt-rly-tracker-3.datto.com 9378 lnv7bc4241e2.1528.ozvision.ozsn.net 22791 dlt-rly-tracker-1.datto.com 88922 pw-file 94560 lnv7bc4241e2.1528.ozvision.ozsn.net 13245 - 63604 pw-file 435839 pw-file 95473 - 13856 pw-file 210705 pw-file 30046 - 106917 dlt-rly-tracker-2.datto.com 415925 pw-file 170471 pw-file 73971 - 86885 dlt-rly-tracker-3.datto.com 162764 pw-file 74791 pw-file </code></pre> <p>第二个数据帧:</p> ^{pr2}$ <p>我要做的是获取hostname的第一个值(dlt-rly-tracker-3)。达图网)并使用第二个数据帧中的所有主机名值(逐个计算)计算levenshtein距离。将此过程结束时的结果存储在一个新的数据帧中,该数据帧类似于以下内容:</p> <pre><code>Indexes Distance Hostnames 85608-93358 23 dlt-rly-tracker-3.datto.com,device.dattobackup.com 85608-34067 60 dlt-rly-tracker-3.datto.com,dlt-rly-tracker-5.datto.com </code></pre> <p>我真的很感激能帮我解决问题。谢谢。在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我的建议是解决这个问题。在</p> <pre><code>import pandas as pd from nltk import edit_distance </code></pre> <p>这里需要创建两个数据帧。我假设它们被称为:</p> <p>df1型</p> <p>df2型</p> ^{pr2}$
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
找出给定numb上下最近的元素
7 回答
找出给定N个数中K的倍数
6 回答
找出给定列表中哪个坐标是虚坐标?
1 回答
找出给定多边形边的两个区域是否相交
4 回答
找出给定对象的可用属性(和方法)的最佳方法是什么?
6 回答
找出给定数字的可能组合
5 回答
找出给定数据中每列中缺少值的百分比
7 回答
找出给定范围内的所有素数
1 回答
找出编码不正确的数据库条目
6 回答
找出肯肯拼图“乘法”域中所有可能的因素
4 回答
找出脚本的下载位置
9 回答
找出芹菜任务是否存在
8 回答
找出行之间的绝对差异并将其与其他行进行比较
8 回答
找出表中for项和rang中for数的区别
3 回答
找出表单是否已提交或页面是否已刷新
6 回答
找出要删除的内容
9 回答
找出谁使用python登录linux
6 回答
找出谁在学生中得分最高
4 回答
找出谁杀了一个python windows服务
9 回答
找出起始时间和结束时间之间的值
3 回答