假设我在DataFrame中有数据集:
Sr.No|query
-----------
1. tiger
2. tigers
3. lion
4. lionx
5. ilion
6. 56tigers
结果数据集应包含:
Sr.No|query
-----------
1. tiger
2. tiger
3. lion
4. lion
5. lion
6. tiger
我不知道怎么做,所以如果你能给任何链接/书名与代码,将是首选。我知道这是一个广泛的话题,可能会使用nltk和聚类算法,如kNN。但是任何形式的帮助都会被感激的
Tags:
目前没有回答
相关问题 更多 >
编程相关推荐