spark数据帧不在之后删除列测向下降（）操作

game_reviews = spark.read.format("csv").option("header", "true").load("./amazon_reviews_us_Video_Games_v1_00.tsv") #reading is fine game_reviews_2_columns =game_reviews.drop( 'marketplace','review_id','product_parent','product_title','product_category', 'helpful_votes' ,'total_votes','vine','verified_purchase','review_headline', 'review_body','review_date')

1条回答

网友

1楼 · 发布于 2024-06-25 23:07:23

它没有正确读取标题，它是一个列和标签的巨大字符串列表。你知道吗

game_reviews = spark.read.format("csv").option("header", "true").
    option("delimiter","\t"). #this is the parameter

load("./amazon_reviews_us_Video_Games_v1_00.tsv")

我可以指定schema并包含它，但它工作得很好。你知道吗

编程相关推荐

java传递实现接口的内部类
java为什么managedbean方法在post请求中的过滤器调用之前调用
java Android应用程序在Android M，O上崩溃，登录A/libc时出错：tid 17938中的致命信号11（SIGSEGV），代码2，故障地址0x343a2944
java JPA存储库。findByAll（）返回null，但数据库中存在所有内容
用于发送电子邮件的java Ant脚本
Java小程序HTML页面发生了奇怪的事情
在Postman的请求正文中传递多个JSON数据，并使用Jersy（JXRS）进入Java Rest API
无法强制转换java DAO类
10分钟后重新连接java
正则表达式如何在java中选择字符串直到某个字符

相关问题更多 >

编程相关推荐

热门问题

热门文章

spark数据帧不在之后删除列测向下降（）操作

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >