使用regex向列表中添加项目以搜索正确的标题

网友

1楼 · 编辑于 2024-09-29 19:35:17

您不需要regex，只需执行以下代码：

myLoad =[
['Unit 1000', '', ''],
['A1', 'Food', 'Good'],
['A3', 'Drink', 'Poor'],
['A6', 'Food', ''],
['Unit 1001',  '', ''],
['A7', 'Cheese', 'Yellow'],
['A8', 'Coke', 'Brown']]
unit = 0
for i in myLoad:
   if 'Unit' not in i[0]:
      print(', '.join([unit,i[0],i[1],i[2]]))
   else:
      unit = i[0].split()[-1]

输出：

1000, A1, Food, Good
1000, A3, Drink, Poor
1000, A6, Food, 
1001, A7, Cheese, Yellow
1001, A8, Coke, Brown

网友

2楼 · 编辑于 2024-09-29 19:35:17

如果你想解决这个问题，你可以试试这个

df= pd.DataFrame(myLoad)
df.loc[df[1]=='','new']=df[0].str.strip('Unit ')
df['new']=df['new'].fillna(method='ffill')
df=df[['new',0,1,2]]
df=df[df[1]!='']
print df.values

输出：

[['1000' 'A1' 'Food' 'Good']
 ['1000' 'A3' 'Drink' 'Poor']
 ['1000' 'A6' 'Food' '']
 ['1001' 'A7' 'Cheese' 'Yellow']
 ['1001' 'A8' 'Coke' 'Brown']]

说明：

将列表转换为数据帧
为单位值创建新列。通过正向填充方法填充NaN值
提取所需行

网友

3楼 · 编辑于 2024-09-29 19:35:17

我不会在这里使用regex

myLoad =[
    ['Unit 1000', '', ''],
    ['A1', 'Food', 'Good'],
    ['A3', 'Drink', 'Poor'],
    ['A6', 'Food', ''],
    ['Unit 1001',  '', ''],
    ['A7', 'Cheese', 'Yellow'],
    ['A8', 'Coke', 'Brown'] ]

lst = []
for x in myLoad:
    if x[0].startswith('Unit'):
        unit = x[0].split()[1]
        continue   
    lst.extend([[unit] + x])   # or lst.append([unit] + x)

print(lst)

# [['1000', 'A1', 'Food', 'Good'], 
#  ['1000', 'A3', 'Drink', 'Poor'], 
#  ['1000', 'A6', 'Food', ''], 
#  ['1001', 'A7', 'Cheese', 'Yellow'], 
#  ['1001', 'A8', 'Coke', 'Brown']]

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用regex向列表中添加项目以搜索正确的标题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >