Python中文
首页
教程
问答
标签
搜索
登录
注册
删除非二元或三元(Yake)的关键字
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在使用Yake(另一个关键字提取器)从数据帧中提取关键字。 我只想提取bigram和trigram,但是Yake只允许设置最大ngram大小,而不允许设置最小大小。你将如何移除它们</p> <p>示例df.head(0):</p> <p>正文: “是的,是的,我咕哝着说,语言的转变现在已经悬而未决了。”</p> <p>关键词: “[('oui',0.04491197687864554), (“语言过渡”,0.09700399286574239), ('mumbled',0.1583169277998726)]”</p> <p>我想从关键字栏中删除oui、MUMMED和他们的分数</p> <p>谢谢你抽出时间</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>如果需要处理Yake的Monogram大小写,只需将输出通过一个过滤器,该过滤器仅在该元组的第一个元素中有空格或该元素的str.split()导致多个子元素时,才会将n-gram添加到结果列表中。如果您正在使用一个函数并将其应用于数据帧,请将此步骤包括在该函数中</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
“matplotlib”ImportError:DLL加载失败:%1不是有效的Win32应用程序
6 回答
“matplotlib”中对字体设置的奇怪响应
9 回答
“matplotlib”如何将绘图调整为图形大小?
2 回答
“Matplotlib不支持生成器作为输入。当我尝试使用scatter()打印列表时”
9 回答
“matplotlib中的点悬停时是否可能显示标签?”
3 回答
“max_features”如何限制sklearn集成模型中的特征数量?
2 回答
“max_poolig2d_3/MaxPool”的1减去2导致维度大小为负
1 回答
“maxiter”参数对中的方法“SLSQP”有效吗scipy.optimize.minimize?
3 回答
“maxRunningTime”选项的格式(谷歌人工智能平台)
9 回答
“MDMenuItem”对象在MDDropdownMenu上没有属性“callback”
7 回答
“Mean”不适用于Pandas数据帧,从Pickle读取16 x 200000+个观察值
4 回答
“MediaDefiningClass”对象不是iterable Djangoimportexp
2 回答
“Medicine”对象没有属性“add”错误
4 回答
“MergeSummary”Op的“inputs”具有与预期类型字符串不匹配的类型[bool,bool,bool,bool,bool,bool,bool]
6 回答
“message”:“所需的请求部分“file\”不存在”
6 回答
“message”是Django还是Python中的保留字?
4 回答
“method”和“method”的实例之间不支持“<”,Python,Djang
9 回答
“method”对象不可订阅。不知道怎么了
6 回答
“Method”对象不是iterab
2 回答
“method”对象不是iterable dataframe python
1 回答