Python中文
首页
教程
问答
标签
搜索
登录
注册
在Sp中使用标点的非闭合字符类
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在尝试构建一个正则表达式模式来删除字符串中的标点符号。我决定使用<code>string</code>库中的<code>punctuation</code>。但是,当我执行它时,Spark返回一个错误,其中有一个未闭合的字符。在</p> <p>我怀疑<code>punctuation</code>中的字符在执行过程中结束了一个引号。我觉得这应该很容易解决,但我不确定如何解决。我的代码如下:</p> <pre><code>from pyspark.sql.functions import regexp_replace, trim, col, lower import string def removePunctuation(column): no_punct = regexp_replace(column, string.punctuation, '') lowered = lower(no_punct) cleaned = strip(lowered) return cleaned </code></pre> <p>我得到这个错误<code>org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 86.0 failed 1 times, most recent failure: Lost task 0.0 in stage 86.0 (TID 3709, localhost): java.util.regex.PatternSyntaxException: Unclosed character class near index 31</code></p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<pre><code>column = regexp_replace(column, '[^\w\s]', '') column = regexp_replace(column, '_', '') </code></pre> <p>请注意,下划线被视为合法的字母数字字符,因此需要特殊删除。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
3 回答
无法使用Django\u mssql\u后端迁移到外部hos
3 回答
无法使用Django&Python3.4连接到MySql
1 回答
无法使用Django+nginx上载媒体文件
7 回答
无法使用Django1.6导入名称模式
6 回答
无法使用Django1.7和mongodb登录管理站点
4 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
10 回答
无法使用Djangockedi验证CBV中的字段
3 回答
无法使用Djangocketditor上载图像(错误400)
4 回答
无法使用Djangocron进行函数调用
8 回答
无法使用Djangofiler djang上载文件
8 回答
无法使用Djangokronos
7 回答
无法使用Djangomssql provid
5 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
10 回答
无法使用Djangomssq迁移Django数据库
6 回答
无法使用Djangonox创建用户
4 回答
无法使用Djangopyodb从Django查询SQL Server
9 回答
无法使用Djangopython3ldap连接到ldap
5 回答
无法使用Djangoredis连接到redis
8 回答
无法使用Django中的FK创建新表
6 回答