Python中文
首页
教程
问答
标签
搜索
登录
注册
如何使用pysp筛选不包含任何子字符串列表的数据帧行
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个带有Spark 1.6的python数据帧。例如</p> <pre><code>DF= ("timestamp","canal", "name") </code></pre> <p>示例数据:</p> <pre><code> [('1980-02-24'),('google.com/General'),('Alice')] [('1980-02-24'),('google.com/Dataset'),('bob')] [('1980-02-24'),('googleserach.com'),('Malik')] [('1980-02-24'),('googlesearch.com/AIPlateforme'),('AliceBob')] [('1980-02-24'),('yahooserach.com'),('Bob2')] [('1980-02-24'),('yahoosearch.com/AIPlateforme'),('Alice2')] DF.count() = 6 </code></pre> <p>我想把所有的线,那<code>"canal"</code><code>not contain</code><code>substring</code><code>googleserach.com</code>和<code>yahoosearch</code></p> <p>我创建了一个变量:</p> <pre><code>canal_2 = "googleserach.com,yahoosearch" </code></pre> <p>然后:</p> <p>解决方案1:</p> <pre><code>result = DF.filter(~DF.canal.isin (canal_2)) ==> does not work result.count() = 6 </code></pre> <p>解决方案2:</p> <pre><code>if (canal2 not in DF.canal) ==> invalid syntax </code></pre> <p>如何在数据帧上进行过滤,以获取“canal”不包含<code>googlesearch</code>和<code>yahoosearch</code>的行?你知道吗</p> <p>谢谢</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你知道吗测向滤波器(~df[“运河”].isin(运河2)).collect() 试试这个。你知道吗</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
想用靓汤抢夺价值
2 回答
想申请一份符合工作描述的简历吗
3 回答
想画网格,Python
5 回答
想白痴化我的Python战舰
7 回答
想看两列日期,但只上
5 回答
想看看我写的这个脚本读一个Fortran二进制fi吗
10 回答
想知道Django是如何实现ORM查询优化的吗
8 回答
想知道GeoDjango和地图服务吗
3 回答
想知道Image.resize操作在PIL文件中的详细工作方式吗
4 回答
想知道matplotlib pyplot为什么不调整边距
9 回答
想知道matplotlib颜色的颜色代码吗
5 回答
想知道pd.factorize,pd.get_dummies,sklearn.preprocessing.labeencoder和OneHotEncod之间的区别
10 回答
想知道property()在python中的实际用法吗
4 回答
想知道pyodidejs是如何工作的吗?
8 回答
想知道pyparsing==2.0.1的已完成处理依赖关系
7 回答
想知道ScikitLearn中的编码算法吗
2 回答
想知道VTK 5.04和VTK 5.4.2的vtkMassProperties差异吗
1 回答
想知道一个特定字符在一个特定句子中出现的次数吗
7 回答
想知道两个不同子集的重叠中有多少个对象吗
6 回答
想知道为什么is_素数函数的结果不正确吗
5 回答