如何利用列数据进行大数据的统计分析问题的回答

如何利用列数据进行大数据的统计分析

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

在我的数据集中，我有48000个村庄，每个村庄有10到12种作物，每个村庄每种作物的播种面积，我想找出哪些作物在哪些村庄有主要的种植面积，在所有作物中，作物1到2的百分比是多少。。。在那个村子里种庄稼。i、我想知道村庄里农作物的比例，如果A村有农作物1和2，那么A村的农作物1和2的比例是多少 所以，接下来我可以为特定的作物。所以之后，我就可以了解哪些作物是大面积播种给哪些村庄的。你知道吗 <pre><code> District Taluka Village Name Crop Area in hec 0 Ahmednagar Pathardi Alhanwadi Bajara 370.0 1 Ahmednagar Pathardi Adgaon Bajara 302.0 2 Ahmednagar Pathardi Ambika Nagar Bajara 40.0 3 Ahmednagar Pathardi Bharajwadi Bajara 90.0 4 Ahmednagar Pathardi Bhalgaon Bajara 254.0 5 Ahmednagar Pathardi Bhawarwadi (N.V.) Bajara 35.0 6 Ahmednagar Pathardi Badewadi Bajara 17.0 7 Ahmednagar Pathardi Akola Bajara 175.0 8 Ahmednagar Pathardi Auranjpur Bajara 35.0 9 Ahmednagar Pathardi Agaskhand Bajara 100.0 10 Ahmednagar Pathardi Alhanwadi Cotton 150.0 11 Ahmednagar Pathardi Adgaon Cotton 310.0 12 Ahmednagar Pathardi Ambika Nagar Cotton 131.0 13 Ahmednagar Pathardi Bharajwadi Cotton 161.0 14 Ahmednagar Pathardi Bhalgaon Cotton 562.0 15 Ahmednagar Pathardi Bhawarwadi (N.V.) Cotton 211.0 16 Ahmednagar Pathardi Badewadi Cotton 104.0 17 Ahmednagar Pathardi Akola Cotton 550.0 18 Ahmednagar Pathardi Auranjpur Cotton 0.0 19 Ahmednagar Pathardi Agaskhand Cotton 0.0 20 Ahmednagar Pathardi Alhanwadi Soybean 26.0 21 Ahmednagar Pathardi Adgaon Soybean 52.0 22 Ahmednagar Pathardi Ambika Nagar Soybean 72.0 23 Ahmednagar Pathardi Bharajwadi Soybean 88.0 24 Ahmednagar Pathardi Bhalgaon Soybean 90.0 25 Ahmednagar Pathardi Bhawarwadi (N.V.) Soybean 93.0 26 Ahmednagar Pathardi Badewadi Soybean 100.0 27 Ahmednagar Pathardi Akola Soybean 10.0 28 Ahmednagar Pathardi Auranjpur Soybean 45.0 29 Ahmednagar Pathardi Agaskhand Soybean 20.0 30 Ahmednagar Pathardi Alhanwadi Maize 10.0 31 Ahmednagar Pathardi Adgaon Maize 1.5 32 Ahmednagar Pathardi Ambika Nagar Maize 3.0 33 Ahmednagar Pathardi Bharajwadi Maize 5.0 34 Ahmednagar Pathardi Bhalgaon Maize 12.0 35 Ahmednagar Pathardi Bhawarwadi (N.V.) Maize 51.0 36 Ahmednagar Pathardi Badewadi Maize 5.0 37 Ahmednagar Pathardi Akola Maize 25.0 38 Ahmednagar Pathardi Auranjpur Maize 5.0 39 Ahmednagar Pathardi Agaskhand Maize 10.0 </code></pre> <hr/> <pre><code>import pandas as pd import numpy as np D=pd.read_excel("/media/desktop/Sample-2.xlsx","Sheet1") village=D["Village Name"].unique() crop=D["Crop"].unique() q1=[] for i in village: for j in crop: a=D["Village Name"]==i b=D["Crop"]==j D1=D[a&b] q1.append(D1) q2=[] for i in q1: if i.empty==False: q2.append(i) </code></pre> 现在我们可以得到村庄的作物播种面积，单位为公顷，接下来我们要计算村庄A%的作物-1，%的作物-2。。。%作物-n 公式：对于村庄A，作物-1是作物-1/该村庄的所有作物，我们得到该村庄的作物-1%，同样的方法得到作物-2的百分比。你知道吗 所有村庄都一样。你知道吗 有什么建议吗？你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何利用列数据进行大数据的统计分析

1 个回答

相关Python问题