Pypark levenshtein加入我想执行基于Levenshtein距离的连接。在 我有两张桌子: Data:这是HDFS文件存储库中的CSV。其中一列是Diseasedescription,15K行。在 df7_ct_map:我从 ...2024-10-01 已阅读: n次