擅长:python、mysql、java
<p>考虑以下几点。在</p>
<pre><code>import pandas as pd
df = pd.DataFrame({'ID':['D0119', 'D0119', 'D0117', 'D0110', 'D1011', 'D1011', 'D1001', 'D1001'],
'Condition':['Bad', 'Good', 'Bad', 'Bad', 'Bad', 'Good', 'Bad', 'Bad'],
'Confirmed':['Yes', 'No', 'Yes', 'Undefined', 'Yes', 'Yes', 'Yes', 'Yes']})
df_grp = df.loc[df['Confirmed'] != 'Undefined'].groupby('ID')
summary = pd.DataFrame({'Condition':df_grp['Condition'],
'pnt_bad':df_grp['Condition'].apply(lambda x: sum(x=='Bad')/len(x))})
</code></pre>
<p>请注意,这种方法不会保留只有“未定义”状态的记录的外观。在</p>