在Spark DataFram中选择第二列或更多列时获取“null”

2024-10-05 11:22:49 发布

您现在位置:Python中文网/ 问答频道 /正文

例如,我有以下XML文件:

<root>
  <first>
    <a>textA</a>
  </first>
  <second>
    <b>textB</b>
  </second>
  <third>
    <c>textC</c>
  </third>
</root>

我通过databricksxml包将它加载到Spark中,一切看起来都很好,加载正确。 当我尝试选择firstfirst.a时,我就得到了正确的结果

但是如果我试图得到secondsecond.b,或thirdthird.c,那么我得到null

我尝试了直接查询,选择函数,一切,我不知道是什么问题。 rowTag是root。 有什么想法吗

更新:没关系,很明显这是spark xml包中的一个bug。谢谢


Tags: 文件rootxmlnullsparkfirstsecondthird

热门问题