我有一个带有如下文本列的数据框:
product
"HI Celebrate Cake White 612612"
"GO Choc Celebrat bl 682222"
"BI Chocolate Buttercream f34 9282222"
"Graduation Cake 28"
"Slab Image Cake 13273"
"Slab Celebration Cake 2556659"
"Grain Bread"
我想在第三个字之后把所有的东西都去掉。如何使用pyspark或sparksql来执行此操作?你知道吗
Tags:
我找到了解决办法:
您可以使用正则表达式来提取前三个单词。你知道吗
相关问题 更多 >
编程相关推荐