如何从一个大数据集的一列中分割一个字符串?

2024-09-29 19:34:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个只有一列的大数据集。 像这样

zinc finger protein 185 OS=Homosapiens OX=9606 GN=ZNF PE=1 SV=3
podocin OS=Homosapiens OX=9606 GN=NPHS2 PE=1 SV=1

我试图将Jupyter笔记本中GN=使用Pandas之后的字符切分为一列。 就像

ZNF185
NPHS2

谢谢


Tags: 数据os笔记本jupyteroxpesvprotein
1条回答
网友
1楼 · 发布于 2024-09-29 19:34:16

我不确定这是否是您想要的,但您可以通过执行以下操作获得单独的数据集:

a = "OX=9606 GN=ZNF PE=1 SV=3 podocin OS=Homosapiens OX=9606 GN=NPHS2 PE=1 SV=1"
[gn_word for gn_word in a.split() if word.startswith('GN=')]

相关问题 更多 >

    热门问题