回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p><strong>我有一个包含3列的数据集“df”</p>
<pre><code>>> Original Data
Student Id Name Marks
0 id_1 John 112
1 id_2 Rafs 181
2 id_2 Rafs 182
3 id_2 Rafs 183
4 id_3 Juan 222
5 id_3 Juan 312
6 id_3 Roller 21
</code></pre>
<p><strong>尝试保持“学生Id”和“姓名”列不变,但将“标记”转换为多个列。这样,每个唯一的“学生Id”和“姓名”将有一行所有可能的标记。此外,我们不需要手动创建列,但它应该根据值动态创建</p>
<pre><code>>> Expected Output
Student Id Name Marks1 Marks2 Marks3
0 id_1 John 112 <NA> <NA>
1 id_2 Rafs 181 182 183
2 id_3 Juan 222 312 <NA>
3 id_3 Roller 21 <NA> <NA>
</code></pre>
<p><strong>复制输入的样本数据</strong></p>
<pre><code>import pandas as pd
data = [
["id_1", 'John', 112],
["id_2", 'Rafs', 181],
["id_2", 'Rafs', 182],
["id_2", 'Rafs', 183],
["id_3", 'Juan', 222],
["id_3", 'Juan', 312],
["id_3", 'Roller', 21]
]
df = pd.DataFrame(data, columns = ['Student Id', 'Name', 'Marks'])
</code></pre>
<p><strong>我尝试了下面的</strong>但是没有得到想要的输出。它在括号()中给出了结果,并且缺少标记</p>
<pre><code>df3 = df.pivot_table(index=['Student Id','Name'], columns='Marks', aggfunc = 'max')
>>Output
Empty DataFrame
Columns: []
Index: [(id_1, John), (id_2, Rafs), (id_3, Juan), (id_3, Roller)]
</code></pre>