John Snow Labs NLU为NLP&NLU提供了最先进的算法,包括60多种语言的数百个预训练模型。它通过强大的Pythonic和Keras启发的API实现了快速、简单的开发和研究。它是由约翰斯诺实验室强大的火花NLP库。
nlu的Python项目详细描述
NLU:Spark-NLP的力量,Python的简单性
johnsnow Labs的NLU是一个Python库,用于直接在任何数据帧上应用最先进的文本挖掘,只需一行代码。 作为屡获殊荣的Spark NLP库的一个门面,它提供了数百种经过预训练的模型,它们都是生产级的、可扩展的、可培训的。在
项目网站
请看我们的Spark NLU官方页面:https://nlu.johnsnowlabs.com/,查看用户文档和示例
NLU在行动
NLU入门
要掌握NLU的强大功能,只需通过pip安装它,并确保java8已安装并正确配置。签出Quickstart for more infos
pip install nlu
用1行python中的任何模型加载和预测
^{pr2}$一条线上多个模型的加载和预测
在一行中获取6个不同的嵌入,并将它们用于下游的数据科学任务!在
nlu.load('bert elmo albert xlnet glove use').predict('I love NLU! <3')
NLU提供什么样的模式?在
NLU在一行代码中提供了数据科学家可能想要的一切!在
- NLU在一行代码中提供了数据科学家可能想要的一切!在
- 350多个预先培训的模型
- 100+最新的NLP单词嵌入(BERT,ELMO,ALBERT,XLNET,GLOVE,BIOBERT,ELECTRA,covidert)及其不同变体
- 50+最新NLP句子嵌入(BERT,ELECTRA,USE)及其不同变体
- 50+分类词(NER、POS、情感、讽刺、问题、垃圾邮件)
- 40多种支持的语言
- 标记和未标记的依赖关系分析
- 各种文本清理和预处理方法,如词干、柠檬化、规范化、过滤、清理管道等
分类器训练在许多不同的数据集上
为正确的任务选择正确的工具!无论你分析电影还是twitter,NLU都有适合你的模型!在
- trec6分级机
- trec10分类器
- 垃圾邮件分类器
- 假新闻分类器
- 情感分类器
- 网络欺凌分类器
- 讽刺分类器
- 电影情感分类器
- IMDB电影情感分类器
- Twitter情感分类器
- 内尔预先练习了笔记
- 内尔训练器
- 维基20语言数据集上20种语言的语言分类器。在
数据科学NLU应用程序的实用程序
处理文本数据有时可能是一项相当肮脏的工作。NLU通过提供大量的组件来消除数据工程密集型任务,帮助您保持清洁。在
- 日期时间匹配器
- 图案匹配器
- 块匹配器
- 短语匹配器
- 停止字清除器
- 图案清洁器
- 俚语清洁剂
我在哪里可以看到NLUs的全部报价?在
签出NLU Namespace所有的NLU必须提供!在
支持的数据类型
- 熊猫数据帧和系列
- Spark数据帧
- 带射线后端的Modin
- 带有Dask后端的Modin
- Numpy阵列
- 字符串和字符串列表
查看以下笔记本,了解如何使用NLU的示例。在
关于数据集的NLU演示
- Kaggle Twitter Airline Sentiment Analysis NLU demo
- Kaggle Twitter Airline Emotion Analysis NLU demo
- Kaggle Twitter COVID Sentiment Analysis NLU demo
- Kaggle Twitter COVID Emotion Analysis nlu demo
NLU组件示例
以下是Collab示例,展示了每个NLU组件和一些应用程序。在
- 在
命名实体识别(NER)
在 - 在
词性(POS)
在 - 在
分类器
在 - 在
嵌入词ings
在 - 在
句子嵌入
在 - 在
依赖解析
- {a33}
- {a34}
- 在
文本预处理和清理
- Tokenization
- Stopwords removal
- {a37}
- {a38}
- {a39}
- Spellchecking
- Sentence Detecting
- 在
Chunkers
- {a42}
- {a43}
- 在
火柴
- {a44}
需要帮助吗?在
- Ping us on Slack
- {a46}
简单的恶魔
- 项目
标签: