如何只获取文件名而不获取扩展名？

relfilepath 0 20210322636.pdf 12 factuur-f23622.pdf 14 ingram micro.pdf 19 upfront.nl domein - Copy.pdf 21 upfront.nl domein.pdf Name: relfilepath, dtype: object

from pathlib import Path for i, row in dffinalselection.iterrows(): dffinalselection['xmlfilename'][i] = Path(dffinalselection['relfilepath'][i]).stem dffinalselection['xmlfilename'] = dffinalselection['xmlfilename'].astype(str)

2条回答

网友

1楼 · 编辑于 2024-06-26 08:30:05

如果列值始终是文件名/文件路径，请使用maxsplit参数1从.的右侧将其拆分，并获取拆分后的第一个值

>>> df['relfilepath'].str.rsplit('.', n=1).str[0]

0                  20210322636
12              factuur-f23622
14                ingram micro
19    upfront.nl domein - Copy
21           upfront.nl domein
Name: relfilepath, dtype: object

网友

2楼 · 编辑于 2024-06-26 08:30:05

您的操作是正确的，但对数据帧的操作是错误的

from pathlib import Path


for i, row in dffinalselection.iterrows():
    dffinalselection['xmlfilename'][i] = Path(dffinalselection['relfilepath'][i]).stem # THIS WILL NOT RELIABLY MUTATE THE DATAFRAME
    dffinalselection['xmlfilename'] = dffinalselection['xmlfilename'].astype(str) # THIS OVERWROTE EVERYTHING

相反，只要做：

from pathlib import Path

dffinalselection['xmlfilename'] = ''
for row in dffinalselection.itertuples():
    dffinalselection.at[row.index, 'xmlfilename']= Path(row.relfilepath).stem

或者

dffinalselection['xmlfilename'] = dffinalselection['relfilepath'].apply(lambda value: Path(value).stem)

相关问题更多 >

编程相关推荐

热门问题

热门文章