将列中的值提取到新列问题的回答

将列中的值提取到新列

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我想将列的内部提取为多个列。这是导入到dataframe后的原始数据 <pre><code>data = {'ID': ['A0001', 'A0002', 'A0003', 'A0004', 'A0005'], 'Name': ['John', 'Micheal', 'Angle', 'Jim', 'Rome'], 'Details': ['Type:\nHouse\nVector:\nTriangle\n\nMission:\nCompleted,lv5\n\nNote user:\n#', 'Type:\n#\nVector:\n\n\nMission:\nFailed\nNote user:\n#', 'Type:\nCar\nVector:\nSquare\nMission:\nCompleted\nNote user:\n', 'Type:\n#\nVector:\n#\nMission:\nCompleted without award\n\nNote user:\nNo end', 'Type:\n#\nVector:\n#\nMission:\n\n\nNote user:\nThere are many mistake.\nI cant choose.\nI cant buy.'] } df = pd.DataFrame (data, columns=['ID', 'Name', 'Details']) df ID Name Details A0001 John Type:\nHouse\nVector:\nTriangle\n\nMission:\nCompleted,lv5\n\nNote user:\n# A0002 Micheal Type:\n#\nVector:\n\n\nMission:\nFailed\nNote user:\n# A0003 Angle Type:\nCar\nVector:\nSquare\nMission:\nCompleted\nNote user:\n A0004 Jim Type:\n#\nVector:\n#\nMission:\nCompleted without award\n\nNote user:\nNo end A0005 Rome Type:\n#\nVector:\n#\nMission:\n\n\nNote user:\nThere are many mistake.\nI cant choose.\nI cant buy. </code></pre> 我想提取“详细信息”列中的值。但我不知道该怎么做 我预期的数据如下所示 <pre><code>data = {'ID': ['A0001', 'A0002', 'A0003', 'A0004', 'A0005'], 'Name': ['John', 'Micheal', 'Angle', 'Jim', 'Rome'], 'Type': ['House', '#', 'Car', '#', '#'], 'Vector': ['Triangle', '', 'Square', '#', '#'], 'Mission': ['Completed,lv5', 'Failed', 'Completed', 'Completed without award', ''], 'Note user': ['#', '#', '', 'No end', 'There are many mistake.I cant choose.I cant buy.'] } df = pd.DataFrame (data, columns=['ID', 'Name', 'Type', 'Vector', 'Mission', 'Note user']) df ID Name Type Vector Mission Note A0001 John House Triangle Completed,lv5 # A0002 Micheal # Failed # A0003 Angle Car Square Completed A0004 Jim # # Completed without award No end A0005 Rome # # There are many mistake.I cant choose.I cant buy. </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

您可以使用<a href="https://docs.python.org/3/howto/regex.html" rel="nofollow noreferrer">regex</a>获得答案。附件中附有文件链接 首先，我用<code>''</code>替换所有<code>\n</code>。这样，所有换行符都将从<code>Details</code>列中删除 然后我抓取两个关键字之间的所有文本。对于类型，数据介于<code>'Type:'</code>和<code>'Vector:'</code>之间。矢量和任务也是如此。注意，我正在抓取<code>'Note user:'</code>之后的所有数据。现在已经从<code>Details</code>列中提取了数据，可以删除该列了 <pre><code>import pandas as pd data = {'ID': ['A0001', 'A0002', 'A0003', 'A0004', 'A0005'], 'Name': ['John', 'Micheal', 'Angle', 'Jim', 'Rome'], 'Details': ['Type:\nHouse\nVector:\nTriangle\n\nMission:\nCompleted,lv5\n\nNote user:\n#', 'Type:\n#\nVector:\n\n\nMission:\nFailed\nNote user:\n#', 'Type:\nCar\nVector:\nSquare\nMission:\nCompleted\nNote user:\n', 'Type:\n#\nVector:\n#\nMission:\nCompleted without award\n\nNote user:\nNo end', 'Type:\n#\nVector:\n#\nMission:\n\n\nNote user:\nThere are many mistake.\nI cant choose.\nI cant buy.'] } df = pd.DataFrame (data, columns=['ID', 'Name', 'Details']) df['Details'] = df.Details.str.replace('\n','', regex=True) df['Type'] = df.Details.str.extract('Type\:(.*)Vector') df['Vector'] = df.Details.str.extract('Vector\:(.*)Mission') df['Mission'] = df.Details.str.extract('Mission\:(.*)Note') df['Note'] = df.Details.str.extract('Note user\:(.*)') print (df[['ID','Name','Type','Vector']]) print (df[['Mission','Note']]) </code></pre> 其输出将为： <pre><code> ID Name Type Vector 0 A0001 John House Triangle 1 A0002 Micheal # 2 A0003 Angle Car Square 3 A0004 Jim # # 4 A0005 Rome # # Mission Note 0 Completed,lv5 # 1 Failed # 2 Completed 3 Completed without award No end 4 There are many mistake.I cant choose.I cant buy. </code></pre>

将列中的值提取到新列

1 个回答

相关Python问题