Python连接和排序3数据帧

bigramf freq Skipgram Freq bigram PMI 0 (Asam, deoksiribonukleat,) 1 (unting, DNA) 22 (12, Å.) 11.487338 1 (deoksiribonukleat,, lebih) 1 (DNA, unting) 22 (22, Å,) 11.487338 2 (lebih, dikenal) 1 (DNA, yang) 20 (220, juta) 11.487338 3 (dikenal, dengan) 2 (yang, DNA) 20 (34, ÅngströmÅ) 11.487338 4 (dengan, singkatan) 1 (DNA, dalam) 13 (A-DNA,, B-DNA,) 11.487338 5 (singkatan, DNA) 1 (dalam, DNA) 13 (Akibatnya,, protein-protein) 11.487338 6 (DNA, ,) 2 (pasangan, basa) 11 (Alec, Jeffreys) 11.487338 7 (,, adalah) 1 (basa, pasangan) 11 (Alfred, HersheyHershey) 11.487338 8 (adalah, sejenis) 1 (terdiri, dari) 10 (Asam, deoksiribonukleat,) 11.487338 9 (sejenis, biomolekul) 1 (dari, terdiri) 10 (Bacillus, subtilis) 11.487338 10 (biomolekul, yang) 1 (pada, DNA) 10 (Banyak, yurisdiksi) 11.487338 ... ... ... ... ... ... ...

bigramf freq Skipgram Freq bigram PMI 72 (unting, DNA) 17 (hidrogen, ikatan) 5 (ditranskripsikan., Para) 11.487338 212 (DNA, yang) 15 (satu, pada) 3 (Temperatur, lebur) 10.487338 136 (pasangan, basa) 10 (dalam, ===) 4 (myeloid, akut.) 11.487338 83 (yang, disebut) 9 (rantai, Proses) 5 (gen., Sedangkan) 11.487338 432 (disebut, sebagai) 9 (unting, disebut) 2 (sama., Karenanya,) 9.902375 58 (terdiri, dari) 9 (DNA, memiliki) 6 (darah,, sperma,) 11.487338 525 (Hal, ini) 8 (disebut, satu) 2 (resisten, terhadap) 9.487338 888 (heliks, ganda) 7 (tergulung, lebih) 2 (banyak, kemungkinan) 7.902375 657 (rantai, DNA) 7 (Diplonema, dan) 2 (sebuah, cara) 8.902375 ... ... ... ... ... ... ...

2条回答

网友

1楼 · 编辑于 2024-05-19 10:24:06

我认为这可以通过如下方式使用原始dataframe列重新编制索引来纠正：

df_bigram = df_bigram.reindex_axis(bigramFreqTable.columns, axis=1)

如果您想按单列排序，那么您上面实现的是正确的。但如果要按多列排序，则可以尝试：

x = df_bigram.sort_values(by=['freq','Freq','PMI'], ascending=False)
x

注意：-按多列排序时，sort_value（）首先使用第一个变量，然后使用第二个变量

网友

2楼 · 编辑于 2024-05-19 10:24:06

问题是，如果无法在最终联接列中进行排序，则只能对bigram的列和freq进行排序，可能的解决方案是首先排序，主要通过^{}和drop=True创建默认索引：

df1 = bigramFreqTable.sort_values(by='freq', ascending=False).reset_index(drop=True)
df2 = skipgram.sort_values(by='Freq', ascending=False).reset_index(drop=True)
df3 = df2.sort_values(by='PMI', ascending=False).reset_index(drop=True)

df_bigram = pd.concat([df1, df2, df3],axis=1)

相关问题更多 >

编程相关推荐

热门问题

热门文章