搜索导入的CSV文件以查找特定文本并生成结果字典

nodule_4mm = '4 mm' result = {} csv_columns = ['Rank','Accession1','MRN1','Textbox2', 'Textbox47','Textbox43','Textbox45', 'ReadBy','SignedBy','Addendum1','ReadDate', 'SignedDate','Textbox49','Result','Impression'] rootdir = '/Users/davidbmccoy/Documents/Chest_Nodule_DataMine'; file = 'NodulesEdited.csv' path = rootdir os.chdir(path) reader = csv.DictReader(open(file, 'rU'), delimiter=',', quotechar='"') for row in reader: for column, value in row.iteritems(): if re.compile(r'\b({0})\b'.format(nodule_4mm), flags=re.IGNORECASE).search: result.setdefault(column, []).append(value) print result

2条回答

网友

1楼 · 编辑于 2024-09-28 21:57:59

从您描述的内容来看，我认为您唯一缺少的是append命令后面的“break”语句。换句话说，如果你已经找到了'4mm'，打破内部循环，这样你就可以进入下一行

网友

2楼 · 编辑于 2024-09-28 21:57:59

我用以下方法解决了这个问题：

reader = csv.DictReader(open(input_file, 'rU'), delimiter=',', quotechar='"')
nodule_size = "([0-4] mm)"

with open (output_file_name, 'w') as f:
    w = csv.writer(f, dialect = 'excel')
    w.writerow(csv_columns)

    for row in reader:
        if re.search(nodule_size,row['Result']) or re.search(nodule_size,row['Impression']):

            w.writerow([row['Rank'],row['Accession1'], row['MRN1'],row['Textbox2'],row['Textbox47'],
                        row['Textbox43'],row['Textbox45'],row['ReadBy'],row['SignedBy'],
                        row['Addendum1'],row['ReadDate'],row['SignedDate'],
                        row['Textbox49'],row['Result'],row['Impression']])

希望能帮助别人！干杯，谢谢你的建议

相关问题更多 >

编程相关推荐

热门问题

热门文章