Python中文
首页
教程
问答
标签
搜索
登录
注册
NLTK自定义分类语料库不读取文件
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我创建了自己的语料库,类似于nltk中的电影评论语料库(按neg | pos分类)</p> <p>在neg和pos文件夹中是txt文件。你知道吗</p> <p>代码:</p> <pre><code>from nltk.corpus import CategorizedPlaintextCorpusReader mr = CategorizedPlaintextCorpusReader('C:\mycorpus', r'(?!\.).*\.txt', cat_pattern=r'(neg|pos)/.*') </code></pre> <p>当我尝试读取或与其中一个文件交互时,我无法。你知道吗</p> <p>例如<code>len(mr.categories())</code>运行,但不返回任何内容:</p> <pre><code>>>> </code></pre> <p>我已经阅读了很多关于自定义分类语料库的文档和问题,但是我仍然无法使用它们。你知道吗</p> <p>完整代码:</p> <pre><code>import nltk from nltk.corpus import CategorizedPlaintextCorpusReader mr = CategorizedPlaintextCorpusReader('C:\mycorpus', r'(?!\.).*\.txt', cat_pattern=r'(neg|pos)/.*') len(mr.categories()) </code></pre> <p>我最终希望能够对我的数据执行一个朴素的贝叶斯算法,但我无法读取内容。你知道吗</p> <p>路径: <code>C:\mycorpus\pos</code></p> <pre><code>C:\mycorpus\neg </code></pre> <p>pos文件中有一个'简历.txt'负片包含'示例.txt'</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我觉得你的头发有点奇怪</p> <pre><code>cat_pattern=r'(neg|pos)/.*' </code></pre> <p>因为您使用的是基于MsDOS的系统(我猜是Windows),文件夹包含用<strong>\,而不是/</strong>(或者我不明白)</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
尽管Python中的所有内容都是引用,为什么Python导师在没有指针的列表中绘制字符串和整数?
3 回答
尽管python中的表达式为false,但循环仍在运行
7 回答
尽管python代码正确,但从nifi ExecuteScript处理器获取语法错误
7 回答
尽管Python在Neovim中工作得很好,但插件不能识别Neovim中的Python主机
4 回答
尽管python字典包含了大量的条目,但它并没有增长
2 回答
尽管python说模块存在,为什么我会得到这个消息?
9 回答
尽管setuptools和控制盘是最新的,但无法识别singleversionexternallymanaged
4 回答
尽管stdout和stderr重定向,但未捕获错误消息
1 回答
尽管Tensorboard的事件太大,但Tensorboard的步骤太少了
2 回答
尽管tkinter上的变量已更改,但显示未更改
7 回答
尽管try/except使用Python进行单元测试时出现断言错误
4 回答
尽管URL是sam,但仍会抛出“达到最大重定向”
10 回答
尽管url有效,Pandas仍读取url的\u csv错误
9 回答
尽管while中存在时间延迟,但LINUX线程的CPU利用率为100%(1)
1 回答
尽管x0在范围内,Scipy优化仍会引发ValueError
2 回答
尽管xpath正确,但使用selenium单击链接仍不起作用
2 回答
尽管下载了ffmpeg并设置了路径变量python,但没有后端错误
5 回答
尽管下载了i,但找不到型号“fr”
1 回答
尽管下载了plotnine包,但未获取名为“plotnine”的模块时出错
4 回答
尽管为所有行指定了权重,网格(0)仍不起作用
1 回答