我想在我的数据集中展开收缩。我得到了结果,但不匹配
这是我试过的代码
contractions_dict = {
"a.l.": "antara lain",
"A.M.v.B.": "Algemene Maatregel van Bestuur",
"gg.": "gang",
"Jl." : "jalan ",
"T." : "teuku",}
# Expanding Contractions
dataset = pd.DataFrame(list_kalimat, columns=['token', 'entitas bernama', 'kalimat'])
dataset.token.replace(to_replace=contractions_dict, inplace=True, value=None, regex=True)
我将展示展开前和展开后单词之间的比较。这是上面代码的结果
奇怪的是为什么单词tengah
中的字母t
也被展开,而单词dianggap
中的gg
也被展开
我想这是因为字典里的句号没有读过,但我不知道它是真是假。我想问的是如何修复它? 多谢各位
目前没有回答
相关问题 更多 >
编程相关推荐