从DataFram中提取复杂数据

2024-06-03 03:37:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我必须分析熊猫数据框中的一些复杂数据。我不知道数据帧中数据的确切结构。我已经从一个Json文件中提取了数据。我使用“head”语法查看顶层数据。你知道吗

如果我想在一个单独的数据框中提取组制造商或营养素,我应该怎样做才能做一些统计分析。你知道吗

with open("nutrients.json") as f:
    objects = [json.loads(line) for line in f]
df = pd.DataFrame(objects) 
print(df.head())

            group manufacturer  \
0  Dairy and Egg Products                
1  Dairy and Egg Products                
2  Dairy and Egg Products                
3  Dairy and Egg Products                
4  Dairy and Egg Products                

                                                meta  \
0  {'langual': [], 'nitrogen_factor': '6.38', 're...   
1  {'langual': [], 'nitrogen_factor': '6.38', 're...   
2  {'langual': [], 'nitrogen_factor': '6.38', 're...   
3  {'langual': [], 'nitrogen_factor': '6.38', 're...   
4  {'langual': [], 'nitrogen_factor': '6.38', 're...   

                                                name  \
0  {'long': 'Butter, salted', 'sci': '', 'common'...   
1  {'long': 'Butter, whipped, with salt', 'sci': ...   
2  {'long': 'Butter oil, anhydrous', 'sci': '', '...   
3  {'long': 'Cheese, blue', 'sci': '', 'common': []}   
4  {'long': 'Cheese, brick', 'sci': '', 'common':...   

                                           nutrients  \
0  [{'code': '203', 'value': '0.85', 'units': 'g'...   
1  [{'code': '203', 'value': '0.85', 'units': 'g'...   
2  [{'code': '203', 'value': '0.28', 'units': 'g'...   
3  [{'code': '203', 'value': '21.40', 'units': 'g...   
4  [{'code': '203', 'value': '23.24', 'units': 'g...   

                                            portions  
0  [{'g': '227', 'amt': '1', 'unit': 'cup'}, {'g'...  
1  [{'g': '151', 'amt': '1', 'unit': 'cup'}, {'g'...  
2  [{'g': '205', 'amt': '1', 'unit': 'cup'}, {'g'...  
3  [{'g': '28.35', 'amt': '1', 'unit': 'oz'}, {'g...  
4  [{'g': '132', 'amt': '1', 'unit': 'cup, diced'...  

Tags: and数据revalueeggcodelongproducts