我有一套单词
{'adalah',
'akan',
'akhir',
'algoritme',
'alur',
'antar',
'antisense',
'asam',
'atas',
'atau',
'bahwa',
'bakteriofag',
'baru',
'basa',
'beranggota',
'berdasarkan',
'berikatan',
'berupa',
'pada',...}
我试图找出集合中的单词是否包含在我拥有的bigramPMITable数据帧中
bigram PMI
0 (itu, adalah) 11.487338
1 (DNA, pada) 6.386371
2 (pada, oleh) 6.386371
3 (pada, basa) 1.105795
4 (yang, satu) 1.105795
5 (gula, yang) 1.044394
6 (yang, tidak) 1.044394
7 (pada, DNA) 0.986496
8 (unting, dalam) 0.931790
9 (DNA, tidak) 0.925095
10 (DNA, menjadi) 0.925095
11 (dan, sebagai) 0.905196
12 (pada, unting) 0.834493
如果是,则预期输出如下:
(itu, adalah) 11.487338
(DNA, pada) 6.386371
(pada, oleh) 6.386371
(pada, basa) 1.105795
(pada, DNA) 0.986496
(pada, unting) 0.834493
他们在bigramPMITable数据框中找到了单词“adalah”和“pada”。我怎么找到?。有人能帮忙吗?谢谢非常感谢您的帮助
具有} 过滤:
set
s和isdisjoint
的第一个溶液,并通过~
反向掩模通过^{或者,您可以使用
isin
创建助手DataFrame
:设置:
性能:
这里有一种使用
sets
的方法(比jezrael的set.isdisjoint
方法慢一些):其中:
相关问题 更多 >
编程相关推荐