LINE TXOBJECT TXNAME TXID LANG TXLINES
1 KNMT 1234 0001 EN
2 * MEA
2 * MEB
2 * MEB
1 KNMT 12345 0001 EN
2 * MEN
2 * MED
2 * MEC
1 KNMT 123456 0001 EN
2 * LADY
2 * BOY
2 * DUDE
我有一个文件,我得到了,我需要在一个新的列中的一些字段,所以我可以把我想要的字段在一个新行,但我不能把第2行的TXNAME列到TXLINES列
我不知道我对我想要什么的解释是否正确,但我会在下面解释我需要什么
我要这个在下面
LINE TXOBJECT TXNAME TXID LANG TXLINES
1 KNMT 1234 0001 EN MEA MEB MEB
1 KNMT 12345 0001 EN MEN MED MEC
1 KNMT 123456 0001 EN LADY BOY DUDE
请建议最好的方法。谢谢
有一种方法:
完整示例:
退货:
解释:
这里的目的是捕获所有
TXOBJECT == "*"
行,其中一种方法是使用我们得到一个LINE列的事实。通过挑选值为1
的行并应用cumsum()我们可以将这些行分组。从这里我们执行twp操作:获取txlines值,然后我们获取每个组的第一行并重新构造数据通过使用
txl = g['TXNAME'].apply(lambda x: ' '.join(x[1:])).values
,您可以得到:如果更清楚的话,您还可以将txl=更改为:
相关问题 更多 >
编程相关推荐