如何在Spark RDD中比较不区分大小写的字符串？

1条回答

网友

1楼 · 发布于 2024-07-08 07:34:38

若要转换为小写，您应该使用lower()函数（请参见here）from{}。因此您可以尝试：

import pyspark.sql.functions as F

logData = spark.createDataFrame(
    [
     (0,'aB'),
     (1,'AaA'),
     (2,'bA'),
     (3,'bB')
    ],
    ('id', "value")
)
numAs = logData.filter(F.lower((logData.value)).contains('a')).count()

您提到“我正在使用下面的代码来计算A数和B数”。请注意，如果要计算某个字符的实际出现次数而不是包含该字符的行数，可以执行以下操作：

^{pr2}$

在上面的示例中，它将返回5。在

希望这有帮助！在

编程相关推荐

性能最小化java进程中的应用程序数据内存开销
java内存数据库，使用内存数据库和maven测试mysql数据库操作API
调度线程时的java JVM公平性
hello world xml中的java错误
泛型如何在java中解决这个不可压缩类型错误？
java在关闭应用程序后是否释放堆内存？
JPanel中的java JScrollPane未显示
java理解问题系统。出来普林顿
java使用共享首选项更改字体样式
使用Java8在文件名和扩展名之间添加中缀的路径

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在Spark RDD中比较不区分大小写的字符串？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >