标记化不使用任何字符串inpu

2024-09-26 18:18:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我之前发布了一个从链接中提取的字符串,我想应用tokenize,但运气不好。所以尝试了一个简化的例子: 我的命令行非常简单:

a="Any Random text at all , nothing freaking works"
sentences = nltk.sent_tokenize(a)

我总是得到:

TypeError: Can't convert 'list' object to str implicitly

我尝试了str.(a)a.splita=a[0],并检查了:

>>> type(a)
<class 'str'>

我的Python有什么问题吗?我已经检查了例子,这显然应该是工作。如果有人能运行并查看是否有结果,如果有,我的Python可能有什么问题,我会非常感激

Added image of error


Tags: 字符串text命令行链接anyrandomallat
1条回答
网友
1楼 · 发布于 2024-09-26 18:18:29

这是nltk包本身的问题。如图所示,不是传入的参数,而是nltk/data.py中的文字[''],它被认为是列表并转换为字符串。你知道吗

重新安装nltk包可能有帮助吗?你知道吗

显示nltk/data.py的第69行,它应该是path = []

相关问题 更多 >

    热门问题