在python中，我如何定位哪个文件有keyerror？

import pandas as pd import numpy as np from pathlib import Path import glob as glob inp_dir = Path(r'C:/Users/jtharian/Desktop/bbc/') for file in inp_dir.glob('*.csv'): df = pd.read_csv(file, sep=',', quotechar='|',error_bad_lines=False) df['confidence'] = df['confidence'].replace(np.nan, 0.01) df.to_csv(file,index=False)

Traceback (most recent call last): File "C:\Users\jtharian\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\indexes\base.py", line 3080, in get_loc return self._engine.get_loc(casted_key) File "pandas\_libs\index.pyx", line 70, in pandas._libs.index.IndexEngine.get_loc File "pandas\_libs\index.pyx", line 101, in pandas._libs.index.IndexEngine.get_loc File "pandas\_libs\hashtable_class_helper.pxi", line 4554, in pandas._libs.hashtable.PyObjectHashTable.get_item File "pandas\_libs\hashtable_class_helper.pxi", line 4562, in pandas._libs.hashtable.PyObjectHashTable.get_item KeyError: 'confidence' The above exception was the direct cause of the following exception: Traceback (most recent call last): File "<ipython-input-1-0cbf17caf540>", line 11, in <module> df['confidence'] = df['confidence'].replace(np.nan, 0.01) File "C:\Users\jtharian\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\frame.py", line 3024, in __getitem__ indexer = self.columns.get_loc(key) File "C:\Users\jtharian\AppData\Local\Continuum\anaconda3\lib\site-packages\pandas\core\indexes\base.py", line 3082, in get_loc raise KeyError(key) from err KeyError: 'confidence'

3条回答

网友

1楼 · 编辑于 2024-09-30 08:24:35

添加try和exception案例：

import pandas as pd
import numpy as np
from pathlib import Path
import glob as glob


inp_dir = Path(r'C:/Users/jtharian/Desktop/bbc/') 

for file in inp_dir.glob('*.csv'):
    try:
        df = pd.read_csv(file, sep=',', quotechar='|',error_bad_lines=False)
        df['confidence'] = df['confidence'].replace(np.nan, 0.01)
        df.to_csv(file,index=False)
    except:
        # assumes error is known
        print("Invalid column in file:", file)

您还可以使用sys module获取异常的错误输出

网友

2楼 · 编辑于 2024-09-30 08:24:35

可能检查列名是否已列出confidence，如果未列出，则中断

import pandas as pd
import numpy as np
from pathlib import Path
import glob as glob


inp_dir = Path(r'C:/Users/jtharian/Desktop/bbc/') 

for file in inp_dir.glob('*.csv'):
    df = pd.read_csv(file, sep=',', quotechar='|',error_bad_lines=False)
    if 'confidence' not in df.columns:
        print('filename: ' + str(file))
        break
    df['confidence'] = df['confidence'].replace(np.nan, 0.01)
    df.to_csv(file,index=False)

网友

3楼 · 编辑于 2024-09-30 08:24:35

打印正在处理的文件的最简单方法

import pandas as pd
import numpy as np
from pathlib import Path
import glob as glob


inp_dir = Path(r'C:/Users/jtharian/Desktop/bbc/') 

for file in inp_dir.glob('*.csv'):
    print(f"Reading: {file}")
    df = pd.read_csv(file, sep=',', quotechar='|',error_bad_lines=False)
    df['confidence'] = df['confidence'].replace(np.nan, 0.01)
    df.to_csv(file,index=False)

相关问题更多 >

编程相关推荐

热门问题

热门文章