我刚到达斯克,所以请容忍我。在
我有一个JSON文件,其中每一行都有以下模式:
{
'id': 2,
'version': 7.3,
'participants': range(10)
}
参与者是一个嵌套字段。在
^{pr2}$我可以选择:df.pluck(['id', 'version'])
或df.pluck('participants').flatten()
但是我如何做一个相当于火花爆炸的,同时我可以选择id
,version
并使{
所以输出结果是:
{'id': 2, 'version': 7.3, 'participants': 0}
{'id': 2, 'version': 7.3, 'participants': 1}
{'id': 2, 'version': 7.3, 'participants': 2}
{'id': 2, 'version': 7.3, 'participants': 3}
...
可以编写一个自定义函数,用
dask.bag.from_sequence
读取并转换文件行我保存了一个名为
^{pr2}$'data.json'
的文件,其中包含以下内容然后用
^{3}$from_sequence
阅读请注意,我刚接触达斯克,这可能不是最有效的方法。在
相关问题 更多 >
编程相关推荐