Python ngrams_专题 - Python中文网

当前热门话题： Python ngrams: 本站为您提供最新、最全的ngrams的Python教程、文档、代码、资源等相关内容，Python中文网技术交流社区同时还提供学习资源下载，如：电子书、IDE编辑器软件、编程视频、代码规范标准、WEB开发、GUI、科学计算与人工智能等相关内容。

本文网址：https://cnpython.com/tags/288433
欢迎加入QQ群-->： 979659372

关于ngrams 相关联的Python项目和问题：

Python nltk计算单词和短语频率

我正在使用NLTK，并试图使单词短语计数到特定文档的特定长度以及每个短语的频率。我标记字符串以获取数据列表。 from nltk.util import ngrams from nltk.tokeni ...

2024-05-21 已阅读: n次

错误类型错误：“str”对象不可调用python

我的代码中有这个错误，我不知道如何修复 import nltk from nltk.util import ngrams def word_grams(words, min=1, max=4): ...

2024-05-21 已阅读: n次

如何在计算机上使用SklearnClassifier

我有一些由它们的双元组表示的列表，以及它们各自出现的次数。这些大字来自于由所有独特的大字组成的词汇。我想用SklearnClassifier（SVC）来解决这个问题到目前为止我所做的代码： tra ...

2024-05-21 已阅读: n次

Python NLTK:Bigrams trigrams-fourgrams

我有这个例子，我想知道如何得到这个结果。我有文本，我标记它，然后收集bigram、trigram和fourgram import nltk from nltk import word_tokenize ...

2024-05-21 已阅读: n次

使用Python NLTK的Kneser-Ney三元图平滑

我试图使用Python NLTK使用Kneser-Ney平滑来平滑一组n-gram概率。不幸的是，整个文档非常稀少。我要做的是：把一个文本解析成一个三元组的列表。从这个列表中，我创建了一个Freq ...

2024-05-21 已阅读: n次

利用语篇搭配统计ngram词频

我想计算一个文本文件中特定单词前后三个单词的频率，这个文本文件已经被转换成标记。你知道吗 from nltk.tokenize import sent_tokenize from nltk.token ...

2024-05-21 已阅读: n次

使用已知的python包实现NGram、TFIDF和余弦相似性

我试图用 N克 TF-IDF公司余弦相似性示例概念： words = [...] word = '...' similarity = predict(words,word) def pr ...

2024-05-21 已阅读: n次

区分过度拟合与良好预测

这些都是关于如何在机器学习中计算和减少过度拟合的问题。我认为许多刚接触机器学习的人都会有同样的问题，所以我试着用我的例子和问题来澄清，希望这里的答案能帮助其他人。我有一个非常小的文本样本，我试图预测 ...

2024-05-21 已阅读: n次

从文件中收集所有NGRAM（及其频率）

我想收集文本中的所有n-gram，并且应该计算它们的频率。这两个难题可以在一个或两个python文件中解决。这是我已经拥有的。现在这应该适用于.txt文件，而不是放在句子中 from nltk imp ...

2024-05-21 已阅读: n次

无法使用xpath、lxm从刮取的页面获取脚本标记的内容

我正在编写一个python程序，作为它的一部分，我需要从googlengramviewer中提取数据。例如搜索： https://books.google.com/ngrams/graph?conte ...

2024-05-21 已阅读: n次

使用Python提取count最常见的句子

我想编写一个Python脚本，搜索所有Excel行并返回前10个最常见的句子。我已经为一个txt文件编写了ngrams的基础知识。你知道吗文件包含csv文本，dj是最好的4倍，gd是酷的3倍。你知 ...

2024-05-21 已阅读: n次

如何将ngrams生成器结果保存到文本文件中？

我正在使用nltk和python从语料库中提取ngram，我需要将生成的ngram保存在一个文本文件中。你知道吗我尝试了此代码，但没有结果： import nltk, re, string, col ...

2024-05-21 已阅读: n次

sliding_window

{a1} ...

2024-05-21 已阅读: n次

ngrams

这些n-grams是基于最大的可公开获得的、体裁平衡的英语语料库——5.2亿字的当代美国英语语料库（coca）。安装 pip install ngrams 示例 from ngrams.g ...

2024-05-21 已阅读: n次

textmetrics

text指标自动文本度量——Bleu、Rouge和Meteor，以及Vocab和恩格拉姆斯。用法 # Compares each candidate (c) separately against ...

2024-05-21 已阅读: n次

cygrams

快速计算前N克。 ...

2024-05-21 已阅读: n次

tf-idf

Python3的TF-IDF实现。功能：停止语任意大小的ngram 词干能够将关键字作为原始文本或标准化文本返回（词干删除，停止字删除）ngrams ...

2024-05-21 已阅读: n次