我正在分析开放式食品事实数据集。 数据集非常混乱,有一个名为“quantity”的列,其条目如下所示:
'100克',
'5盎司(142克)',
'12盎司',
'200克',
'12盎司(340克)',
“10盎司(296毫升)”,
“750毫升”,
'1升',
“250毫升”,
'8盎司',
'10.5盎司(750克)',
“1加仑(3.78升)”,
'27盎司(1磅11盎司)765克',
“75 cl”
正如你所看到的,测量值和单位到处都是!有时这个量是用两种不同的量度给出的。。。
我的目标是在pandas数据框中创建一个新列'quantity\u in\u g',从字符串中提取信息,并基于'quantity'列中的克数创建一个整数值。
因此,如果数量列有'200g',我想要整数200,如果它说'1kg',我想要整数1000。我还想把其他计量单位换算成克。对于“2盎司”,我想要整数56,对于1升,我想要1000。
有人能帮我转换一下这个专栏吗?
我真的很感激!
提前谢谢
相关问题 更多 >
编程相关推荐