回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>我有一个CT胸部检查的大数据集,我需要导入到一个使用python的字典中,搜索选定的文本,然后将选定的行作为csv输出</p>
<p>以下是我目前的代码:</p>
<pre><code>nodule_4mm = '4 mm'
result = {}
csv_columns = ['Rank','Accession1','MRN1','Textbox2',
'Textbox47','Textbox43','Textbox45',
'ReadBy','SignedBy','Addendum1','ReadDate',
'SignedDate','Textbox49','Result','Impression']
rootdir = '/Users/davidbmccoy/Documents/Chest_Nodule_DataMine';
file = 'NodulesEdited.csv'
path = rootdir
os.chdir(path)
reader = csv.DictReader(open(file, 'rU'), delimiter=',', quotechar='"')
for row in reader:
for column, value in row.iteritems():
if re.compile(r'\b({0})\b'.format(nodule_4mm), flags=re.IGNORECASE).search:
result.setdefault(column, []).append(value)
print result
</code></pre>
<p>这里面有几个问题。如果'4毫米'是在行中找到我需要它去结果只有一次。在所有带有“4 mm”的行都在结果中之后,我需要将结果导出为csv</p>
<p>任何帮助都将是巨大的,抱歉,如果这里的格式是关闭的。但是,真的,任何帮助都太好了!p>