2024-06-26 18:06:04 发布
网友
我将这个tweets数据集与Pyspark一起使用,以便处理它,并根据tweet的位置获得一些趋势。但是我在尝试创建数据帧时遇到了一个问题。我正在使用spark.read.options(header="True").csv("hashtag_donaldtrump.csv")创建数据帧,但是如果我查看tweets列,我得到的结果是:
spark.read.options(header="True").csv("hashtag_donaldtrump.csv")
您知道如何清理CSV文件以便Spark处理它吗?提前谢谢你
它看起来像一个多行csv。试着做
df = spark.read.csv("hashtag_donaldtrump.csv", header=True, multiLine=True)
它看起来像一个多行csv。试着做
相关问题 更多 >
编程相关推荐