使用jupyter小部件和pandas快速注释/标记数据。

classypandas的Python项目详细描述


Classy PandasClassy熊猫

使用jupyter widgets和pandas快速注释/标记数据。

有时候,在训练分类模型之前,您需要标记一个数据集。如果你已经在使用jupyter和pandas,为什么不使用一些ipywidget呢?在

先决条件

安装软件需要什么东西以及如何安装

pip install pandas
pip install jupyter
pip install ipywidgets

如果您使用的是jupyter lab,则还需要安装ipywidgets扩展: https://ipywidgets.readthedocs.io/en/latest/user_install.html

安装

一旦安装了上述程序,只需运行:

^{pr2}$

示例

然后,您可以运行这个存储库中demo文件夹中的示例来开始标记!因为内容显示为html,所以您可以将列定义为html字符串,并在屏幕上显示您想要的任何内容。在

代码:

import pandas as pd
from classypandas import core

df = pd.read_csv('demo.csv')
labels = ['text', 'image', 'other']
classy = core.Classy(df, 'html', 'label', labels)
classy.display()

预览:

Example 1

然后,您可以随时检查进度:

Example 1

许可证

这个项目是在麻省理工学院许可下授权的-有关详细信息,请参阅LICENSE.md文件

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在保存信息时切换类的“标准”方式是什么?   java JConsole,用于在JBoss AS7独立模式下远程访问JMX   Maven中未识别java CMD   java做。。虽然带开关菜单   java Javax内容不可访问   从cmd验证日期的java方法   安卓应用程序正在缓存java JSON   java正在尝试使用用户输入的参数创建随机数生成器   java Prompt=在keydove和Spring安全Oauth2之间登录   http没有在java中接收的字节数   在命令行上运行java应用程序(JAR文件)的命令行有我不理解的错误   我需要重命名我在java中生成的json对象的键   java Eclipse重命名/重构会影响javadoc上的变量引用吗?   Java:寻找一个库来读取LDAP数据   包含子实体的参数和数据表的java详细信息