什么是一个好的Python数据结构，它可以存储具有相同索引和一些次要元数据的数据列表？

2条回答

网友

1楼 · 编辑于 2024-09-29 23:32:53

一个可能的解决方案是使用pandas库，尤其是DataFrame对象。如果您不熟悉该库，here是一个简短的入门教程。这个库有很多有用的特性（例如，处理日期/时间数据）。它是否对你有用取决于你想要使用的算法（正如彼得·伍德的评论所建议的那样）。在

对于您的简短示例，可以将data对象构建为DataFrame作为

import pandas as pd
data = pd.DataFrame({'color': ['red', 'green', 'blue'],
                     'mass': [100, 98, 90],
                     'speed': [10,11,9]})

然后您可以访问完整的data对象或其中的特定元素，例如

^{pr2}$

您还可以对列执行操作，并将结果另存为data对象中的新列，例如：

>>data['momentum'] = data['mass']*data['speed']
>>print data
   color  mass  speed  momentum
0    red   100     10      1000
1  green    98     11      1078
2   blue    90      9       810
>>data.loc[2, 'momentum']
810

我不确定的是你想要的元数据位。我知道这是整个对象（不是特定事件）的一些元数据。我不知道向DataFrame添加“global metadata”的简单方法，但是您可以添加一个包含信息的额外列（即使它对于所有事件都是相同的）。在您的例子中：

data = pd.DataFrame({'color': ['red', 'green', 'blue'],
                     'mass': [100, 98, 90],
                     'speed': [10,11,9],
                     'event_type': "2015-12-11T1442Z"})

结果是

>>print data
   color        event_type  mass  speed
0    red  2015-12-11T1442Z   100     10
1  green  2015-12-11T1442Z    98     11
2   blue  2015-12-11T1442Z    90      9

网友

2楼 · 编辑于 2024-09-29 23:32:53

字典（特别是嵌套字典）：

data = {}
index = 123
data[index] = {}
data[index]["color"] = ["red", "green", "blue"]
data[index]["mass"]  = [100, 98, 90]
data[index]["speed"] = [10, 11, 9]
data[index]["metadata"] = {"event_type": "2015-12-11T1442Z"}

通知索引未引用

您也可以将它定义为一个类，每个索引值都定义一个实例，但这可能会超出您的需要

相关问题更多 >

编程相关推荐

热门问题

热门文章

什么是一个好的Python数据结构，它可以存储具有相同索引和一些次要元数据的数据列表？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >