Pandas使用常规索引将多索引数据帧与其他数据帧对齐

M1_01 M1_02 M1_03 M1_04 M1_05 Eventloc Exonloc chr10:52619746-52623793|- 52622648-52622741 0 0 0 0 0 chr19:58859211-58865080|+ 58864686-58864827 0 0 0 0 0 58864686-58864840 0 0 0 0 0 58864744-58864840 0 0 0 0 0 chr19:58863054-58863649|- 58863463-58863550 0 0 0 0 0

Eventloc Exonloc event_id chr3:53274267:53274364:-@chr3:53271813:53271836:-@chr3:53268999:53269190:- chr3:53269191-53274267|- 53271812-53271836 chr2:9002720:9002852:-@chr2:9002401:9002452:-@chr2:9000743:9000894:- chr2:9000895-9002720|- 9002400-9002452 chr1:160192441:160192571:-@chr1:160190249:160190481:-@chr1:160188639:160188758:- chr1:160188759-160192441|- 160190248-160190481 chr7:100473194:100473333:+@chr7:100478317:100478390:+@chr7:100478906:100479034:+ chr7:100473334-100478906|+ 100478316-100478390 chr4:55124924:55124984:+@chr4:55127262:55127579:+@chr4:55129834:55130094:+ chr4:55124985-55129834|+ 55127261-55127579

1条回答

网友

1楼 · 发布于 2024-09-30 08:32:38

如果我理解您在做什么，您需要显式地构造元组（但是它们必须是完全限定的元组，例如，每个级别都有一个值），或者更简单地，构造一个布尔索引器）

In [7]: df1 = DataFrame(0,index=MultiIndex.from_product([list('abc'),[range(2)]]),columns=['A'])

In [8]: df1
Out[8]: 
     A
a 0  0
b 1  0
c 0  0

[3 rows x 1 columns]

In [9]: df1 = DataFrame(0,index=MultiIndex.from_product([list('abc'),list(range(2))]),columns=['A'])

In [10]: df1
Out[10]: 
     A
a 0  0
  1  0
b 0  0
  1  0
c 0  0
  1  0

[6 rows x 1 columns]

In [11]: df3 = DataFrame(0,index=['a','b'],columns=['A'])

In [12]: df3
Out[12]: 
   A
a  0
b  0

[2 rows x 1 columns]

这些是第一帧中级别0的所有值

^{pr2}$

构造结果的布尔索引器

In [14]: df1.index.get_level_values(level=0).isin(df3.index)
Out[14]: array([ True,  True,  True,  True, False, False], dtype=bool)

In [15]: df1.loc[df1.index.get_level_values(level=0).isin(df3.index)]
Out[15]: 
     A
a 0  0
  1  0
b 0  0
  1  0

[4 rows x 1 columns]

相关问题更多 >

编程相关推荐

热门问题

热门文章