擅长:python、mysql、java
<p>我建议您使用一个名为Python记录链接工具箱的库。在</p>
<p>导入库后,必须索引要比较的源,如下所示:</p>
<pre><code> indexer = recordlinkage.Index()
#using url as intersection
indexer.block('id')
candidate_links = indexer.index(df_1, df_2)
c = recordlinkage.Compare()
</code></pre>
<p>假设您想根据字符串的相似性进行比较,但它们并不完全匹配:</p>
^{pr2}$
<p>如果你想要一个精确的匹配,你应该使用:</p>
<pre><code>c.exact('name')
</code></pre>