Python中文
首页
教程
问答
标签
搜索
登录
注册
任意文本间的单词相似度评分
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个500多个非常重要但任意的字符串的列表。它们看起来像:</p> <p><code>list_important_codes = ['xido9','uaid3','frps09','ggix21']</code></p> <p><strong>我所知道的</strong> *大小写并不重要,但所有其他字符必须完全匹配。 *每个字符串以4个字母字符开头,以一个或两个数字字符结尾。 *我有一个大约100000个字符串的列表,<code>list_recorded_codes</code>是手工输入的,应该完全匹配<code>list_important_codes</code>,但其中大约10000个不匹配。因为这些字符串是手动键入的,所以不正确的字符串通常只差1个字符。(错误如下:*增加了空格,*切换了两个字母,*将“1”改为“01”,等等)</p> <p><strong>我需要做什么</strong> 我需要遍历<code>list_recorded_codes</code>,并在<code>list_important_codes</code>中找到它们的所有完美匹配</p> <p><strong>我尝试的</strong> 我花了大约10个小时试图手动编写一种修复每个单词的方法,但这似乎不切实际,令人难以置信地乏味。更不用说,当我的列表在以后翻倍时,我将不得不再次手动执行该过程</p> <p><strong>我认为我需要的解决方案,以及预期输出</strong></p> <p>我希望Python的NLTK能够有效地“评分”这些任意术语,以找到“最佳评分”。例如,如果所讨论的单词是<code>inputword = "gdix88"</code>,那么该单词将与<code>score(inputword,"gdox89")=.84</code>和<code>score(inputword,"sudh88")=.21</code>进行比较。我的预期输出为<code>highscore=.84, highscoreword='gdox89'</code></p> <pre><code>for manually_entered_text in ['xido9','uaid3','frp09','ggix21']: --get_highest_score_from_important_words() #returns word_with_highest_score --manually_entered_text = word_with_highest_score </code></pre> <p>如果需要,我也愿意使用一套不同的工具来解决这个问题。而且,越简单越好!谢谢大家!</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以对这个问题应用动态规划方法。一旦您设置了评分矩阵、校准矩阵以及本地和全局校准函数,您就可以遍历列表重要代码,并在列表记录的代码中找到得分最高的校准。这是我为DNA序列比对做的一个项目:<a href="https://github.com/pakzaban/dynmaic_alignment" rel="nofollow noreferrer">DNA alignment</a>。你可以很容易地使它适应你的问题</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
7 回答
如何添加表示整数的擦边字符串?
10 回答
如何添加要在Bokeh中使用的新font.ttf文件?
8 回答
如何添加要显示的矩阵XY轴编号和XY轴
9 回答
如何添加计数?
8 回答
如何添加计数器函数?
8 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
6 回答
如何添加计数器来跟踪while循环中的月份和年份?
3 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
5 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
4 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
9 回答
如何添加评论拉梅尔亚姆
10 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
9 回答
如何添加谷歌地点自动完成到Flask?
9 回答
如何添加超时、python discord bot
5 回答
如何添加超过1dp的检查
7 回答
如何添加距离方法
2 回答
如何添加跟随游戏的敌人精灵
7 回答
如何添加路径以便python可以找到程序?
7 回答
如何添加身份验证/安全性以使用happybase访问HBase?
8 回答