从pyspark datafram中的字符串列提取单词

2024-09-30 20:39:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含许多行和列的数据帧。我想从一个单独的列中提取单词。在

现有数据帧

|               title|          sale_price|      condition_id|

|"Lenovo ThinkPad ...|              599.00|        1500|
|ASUS ROG GL752VW-...|              999.99|        2000|
|Lenovo IdeaPad S1...|               71.00|        3000|
|Lenovo T520 i5 2....|              210.00|        2500|
|"Dell Inspiron 15...|              508.72|        1000|
|7 Apple Macbook P...|              446.00|        7000|
|Dell Latitude E64...|               41.00|        3000|

我想分开

^{pr2}$

有什么方法可以在pyspark datafram中获取我需要的数据吗


Tags: 数据idtitlesalecondition单词pricedell