我有一个2列的.XLSX文件
还有。该列存储到的多个数据链接,并用分号分隔。我需要操作这个数据集的输入,我有困难的想法,最好的方向做
考虑用(,)替换分号,然后将数据打包到字典中,其中的是“key”,列表的是“value”
然而,我不确定这是最有效的途径
d = {'<Name>':['FIL9791','FIL9799','FIL4056','FIL4056','FIL4057'],'<Item To Package>':['package_113572195;package_113594355','package_113572197;package_113594357','package_113566689;package_113591417','package_113566688;package_113591416','package_113566690;package_113591418']
df =pd.DataFrame(data=d)
df.head()
sku = df['<Name>']
upc = df['<Item To Package>']
PartToUPC = {}
PartToUPC[sku]=upc
下面是我需要的文件如何看
A列中的所有SKU和B列中的各自产品包代码
FIL9791 | package_113572195
FIL9791 | package_113594355
FIL9799 | package_113572197
FIL9799 | package_113594357
等等
我想这就是你需要的
您可以在将列拆分为两个值的列表后使用
.explode()
来解决这个问题输出:
请记住
explode()
保留所应用列的原始索引。因此,如果您希望重置索引,因为您不需要它们来匹配原始索引。您可以添加:输出:
相关问题 更多 >
编程相关推荐