使用jupyter小部件和pandas快速注释/标记数据。
classypandas的Python项目详细描述
Classy熊猫
使用jupyter widgets和pandas快速注释/标记数据。
有时候,在训练分类模型之前,您需要标记一个数据集。如果你已经在使用jupyter和pandas,为什么不使用一些ipywidget呢?在
先决条件
安装软件需要什么东西以及如何安装
pip install pandas
pip install jupyter
pip install ipywidgets
如果您使用的是jupyter lab,则还需要安装ipywidgets扩展: https://ipywidgets.readthedocs.io/en/latest/user_install.html
安装
一旦安装了上述程序,只需运行:
^{pr2}$示例
然后,您可以运行这个存储库中demo文件夹中的示例来开始标记!因为内容显示为html,所以您可以将列定义为html字符串,并在屏幕上显示您想要的任何内容。在
代码:
import pandas as pd
from classypandas import core
df = pd.read_csv('demo.csv')
labels = ['text', 'image', 'other']
classy = core.Classy(df, 'html', 'label', labels)
classy.display()
预览:
然后,您可以随时检查进度:
许可证
这个项目是在麻省理工学院许可下授权的-有关详细信息,请参阅LICENSE.md文件
- 项目
标签: