我有以下格式的数据框:
示例数据帧:
row1:['efcc', 'fficial', 'billiontwits', 'since', 'covid', 'landed']
row2:['when', 'people', 'say', 'the', 'fatality', 'rate', 'of', 'coronavirus', 'is']
row3:['in', 'the', 'coronavirus-induced', 'crisis', 'people', 'are', 'cyvbwx']
row4:['in', 'the', 'be-induced', 'crisis', 'people', 'are', 'cyvbwx']
columns2(sheet_Retrieved_from)包含单词的来源列表:
row1:sheet1
row2:sheet2
row3:sheet3
row4:sheet2
以及一个单词集合,其中包含通过以下代码列出的单词列表:
words_collection=[]
for w in sample.tokenised_text:
for t in w:
words_collection.append(t)
和图纸名称来自:sheetlist=list(set(sample.sheet.to_list()))
然而,如何找到一种正确的方法来迭代数据帧以检查一个单词是否存在于多个表中
基本上,我正在寻找显示以下内容的输出:
相关问题 更多 >
编程相关推荐