Python中文
首页
教程
问答
标签
搜索
登录
注册
如何将多个文件的输出传递到一个数组
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我试图在我的文件上运行lda模型。首先我做了一些预处理,比如标记化和停止字删除。我这样做是为了多个文件,但当我把最终输出传递给lda模型时,它给了我一个错误,我在Google中看到lda将多个文件作为输入。 现在,我想将每个文件的输出存储到一个数组中,然后将该数组作为输入传递,但这也给了我一个错误indexeror:list assignment index out of range。我不知道是什么问题。任何帮助将不胜感激谢谢!你知道吗</p> <pre><code> # URDU STOP WORDS REMOVAL doc_clean = [] stopwords_corpus = UrduCorpusReader('./data', ['stopwords-ur.txt']) stopwords = stopwords_corpus.words() count = 1 # print(stopwords) for infile in (wordlists.fileids()): words = wordlists.words(infile) finalized_words = remove_urdu_stopwords(stopwords, words) doc_clean[count] = finalized_words print(doc_clean) count =count+1 print("\n==== WITHOUT STOPWORDS ===========\n") print(finalized_words) id2word = corpora.Dictionary(doc_clean) mm = [id2word.doc2bow(text) for text in texts] lda = models.ldamodel.LdaModel(corpus=mm, id2word=id2word, num_topics=3, update_every=1, chunksize=10000, passes=1) </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>这里不需要使用<code>count</code>变量。List提供<code>append</code>函数将元素添加到列表中。<br/> 改变这个</p> <pre><code> doc_clean[count] = finalized_words </code></pre> <p>为了这个</p> <pre><code> doc_clean.append(finalized_words) </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
10 回答
无法使用Django\u mssql\u后端迁移到外部hos
7 回答
无法使用Django&Python3.4连接到MySql
2 回答
无法使用Django+nginx上载媒体文件
9 回答
无法使用Django1.6导入名称模式
6 回答
无法使用Django1.7和mongodb登录管理站点
1 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
10 回答
无法使用Djangockedi验证CBV中的字段
10 回答
无法使用Djangocketditor上载图像(错误400)
6 回答
无法使用Djangocron进行函数调用
4 回答
无法使用Djangofiler djang上载文件
10 回答
无法使用Djangokronos
4 回答
无法使用Djangomssql provid
10 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
10 回答
无法使用Djangomssq迁移Django数据库
3 回答
无法使用Djangonox创建用户
8 回答
无法使用Djangopyodb从Django查询SQL Server
9 回答
无法使用Djangopython3ldap连接到ldap
4 回答
无法使用Djangoredis连接到redis
4 回答
无法使用Django中的FK创建新表
2 回答