为什么createDataFrame的推理程序不将此数据列创建为字符串？

# DataFrame construction: b = sqlContext.createDataFrame([(1, 2),(2, 3), (3, 3), ('test0', 'test1')], ['pepe', 'pepa'], samplingRatio=1) b.show() #+----+----+ #|pepe|pepa| #+----+----+ #| 1| 2| #| 2| 3| #| 3| 3| #|null|null| #+----+----+

1条回答

网友

1楼 · 发布于 2024-06-18 11:41:41

发生这种情况是因为当从本地数据结构创建DataFrame时，samplingRatio参数被完全忽略。It is used only if ^{} is a ^{}。否则，数据将转换为javardd，类型不匹配的对象将转换为null。在

如果传递RDD而不是list Spark，则会应用模式推理并引发异常，与Scala中的示例相同。这是因为Spark不支持混合类型，也不执行自动铸造。在

为什么inferSchema参数存在？它看起来像是从Python字典构建的RDDs上不推荐使用的推理的产物。但这只是一个疯狂的猜测。在

编程相关推荐

java死锁2：完全用DB设置控制限制
使用jacksonjava将JSON转换为POJO作为对象类
具有空对象模式的java DAO
java如何检查ExecutorService是否“健康”且正常工作？
java在Intellij Idea下使用Maven和ReactJS启动SpringWeb应用程序项目
java无法在同时键入文本字段时更新TextArea
swing Java投票程序错误
java如何在Android应用程序中执行OCR
java如何用自己的JDK版本配置JBoss？
用于屏蔽字符串起始8个字符的java正则表达式

相关问题更多 >

编程相关推荐

热门问题

热门文章