在dataframe中选择一列并屏蔽副本

2024-06-01 07:09:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这样一个数据帧:-

import pandas as pd

dict_data = {
    'Date':pd.Timestamp('20200720'),
    'Number': 123,
    'course':pd.Series(['Python', 'Quant', 'CFA', 'Finance', 'Python', 'Python', 'Finance', 'Finance']),
    'Company':['AA', 'BB', 'CC', 'DD', 'BB', 'BB', 'DD', 'CC']
}

pd.DataFrame(dict_data)

我可以选择一列。例如,dict_data['course'],它将输出该列的所有数据。我可以知道有什么方法可以屏蔽重复值吗?像这样吗

0     Python
1      Quant
2        CFA
3    Finance

Tags: 数据importpandasdatadateasdictdd
1条回答
网友
1楼 · 发布于 2024-06-01 07:09:43

您可以使用df.drop_duplicates()

df = pd.DataFrame(dict_data)

In [1327]: df.course.drop_duplicates()
Out[1327]: 
0     Python
1      Quant
2        CFA
3    Finance
Name: course, dtype: object

相关问题 更多 >