我打印出组合数组并保存到文本文件中,如下所示:
({
ngram_a67e6f3205f0-n: 1,
logreg_c120232d9faa-regParam: 0.01,
cntVec_9c0e7831261d-vocabSize: 10000
},0.8580469779197205)
({
ngram_a67e6f3205f0-n: 2,
logreg_c120232d9faa-regParam: 0.01,
cntVec_9c0e7831261d-vocabSize: 10000
},0.8880895806519427)
({
ngram_a67e6f3205f0-n: 3,
logreg_c120232d9faa-regParam: 0.01,
cntVec_9c0e7831261d-vocabSize: 10000
},0.8656452460818544)
我希望提取数据以生成python Dataframe,如:
1, 10000, 0.8580469779197205
2, 10000, 0.8880895806519427
为什么不这样做:
Eval获取一个字符串并将其转换为python的文本表示形式,这非常漂亮。这将把每个附加项转换为一个iterator,然后将其存储到一个列表中。Pd dataframe类可以获取具有相同键的字典列表并创建一个dataframe
我的建议是,如果可能的话,更改文件的输入格式。这会大大简化你的生活。
如果这是不可能的,下面的代码可以解决您的问题:
并给出:
简要说明
使用re.findall和regex
pattern_tuples
查找文件中的所有元组对于每个元组,使用regex
pattern_numbers
可以找到您感兴趣的4个数值。这样,您将获得包含您的数据的列表在数据框中输入结果
额外的
以下是如何将简历结果保存为json格式,以便更轻松地管理:
创建
cv_results
数组以保留CV结果对于CVs的每个循环,您将得到一个包含结果的元组
t
,您必须将其转换为字典并挂在数组cv_results
在CV循环的末尾,以json格式保存结果
是的。你知道吗
现在您可以读取json文件,并且可以像普通python字典一样访问所有字段:
相关问题 更多 >
编程相关推荐