使用pandas如何对某些参数（列）进行加权，以便基于加权方式获取输出

>>> import pandas as pd >>> data = {'District': ['Ahmednagar', 'Aurangabad','Jalna','Buldhana','Amravati','Nashik','Pune','Palghar'], 'Soil': ['B','A','D','D','A','B','D','A' ], 'Irrigated': ['B','B','D','A','A','B','C','A' ], 'Seed Variety': ['A','B','B','B','A','A','A','D'] } >>> data {'District': ['Ahmednagar', 'Aurangabad', 'Jalna', 'Buldhana', 'Amravati', 'Nashik', 'Pune', 'Palghar'], 'Soil': ['B', 'A', 'D', 'D', 'A', 'B', 'D', 'A'], 'Seed Variety': ['A', 'B', 'B', 'B', 'A', 'A', 'A', 'D'], 'Irrigated': ['B', 'B', 'D', 'A', 'A', 'B', 'C', 'A']} >>> df = pd.DataFrame (data, columns = ['District','Soil','Irrigated','Seed Variety']) >>> df District ... Seed Variety 0 Ahmednagar ... A 1 Aurangabad ... B 2 Jalna ... B 3 Buldhana ... B 4 Amravati ... A 5 Nashik ... A 6 Pune ... A 7 Palghar ... D [8 rows x 4 columns] >>>

1条回答

网友

1楼 · 发布于 2024-09-28 01:30:28

so when all parameters giving different value, then it will be select output for Irrigated column value [...] if more than 2 times repeated then output will be display as which value repeated 2 times.

因此，这意味着只有当其他两列“土壤”和“种子品种”具有相同的值时，产量才会不同于“灌溉”

因此，我首先填充“输出”以匹配“灌溉”，然后在后续操作中，将其设置为另一列的值，其中另外两列具有相同的值：

df['Output'] = df['Irrigated']
df.loc[df['Soil'] == df['Seed Variety'], 'Output'] = df['Soil']

应该这样做

稍后，如果要计算总百分比，可以将结果“输出”与源列进行比较，然后将其乘以每个权重：

df['Output(%)'] = (
    (df['Output'] == df['Soil']) * 35.0 +
    (df['Output'] == df['Irrigated']) * 40.0 +
    (df['Output'] == df['Seed Variety']) * 25.0
)

相关问题更多 >

编程相关推荐

热门问题

热门文章