如何从for循环创建np数组

bloblist = [doc1, doc2, doc3, doc4, doc5, doc6, doc7, doc8, doc9, doc10, doc11] for i, blob in enumerate(bloblist): print("Top words in doc {}".format(i + 1)) scores = {word: tfidf(word, blob, bloblist) for word in blob.words} sorted_words = sorted(scores.items(), key=lambda x: x[1], reverse=True) corpus = blob.words wordIndex = list(enumerate(corpus)) for word, score in sorted_words[:4]: arr = (corpus.index(word)) print(arr)

1条回答

网友

1楼 · 发布于 2024-09-24 02:22:41

多亏了奥利，我找到了适合我的解决方案。你知道吗

bloblist = [doc1, doc2, doc3, doc4, doc5, doc6, doc7, doc8, doc9, doc10, doc11]
for i, blob in enumerate(bloblist):
    print("Top words in doc {}".format(i + 1))
    scores = {word: tfidf(word, blob, bloblist) for word in blob.words}
    sorted_words = sorted(scores.items(), key=lambda x: x[1], reverse=True)
    corpus = blob.words
    wordIndex = list(enumerate(corpus))
    arr = np.array([])
    for word, score in sorted_words[:4]:
        arrw = np.array([corpus.index(word)])
        arr = np.concatenate((arr, arrw))
    print(arr)
    arr = arr.reshape(4,1)
    print(arr.shape)

提供以下所需输出：

Top words in doc 1
[ 5.  0.  1.  2.]
(4, 1)
Top words in doc 2
[ 19.  12.  41.   4.]
(4, 1)
Top words in doc 3
[ 16.   2.   6.   7.]
(4, 1)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从for循环创建np数组

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >