使用Pysp的XML到Dataframe

2024-10-06 12:29:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试废弃一个XML文件,并从XML文件上的标记创建一个数据帧。我用pyspark开发数据块。在

XML文件:

<?xml version="1.0" encoding="UTF-8"?>
<note>
  <shorttitle>shorttitle_1</shorttitle>
  <shorttitle>shorttitle_2</shorttitle>
  <shorttitle>shorttitle_3</shorttitle>
  <shorttitle>shorttitle_4</shorttitle>
</note>

我的代码似乎要从页面中删除XML并从标记创建一个列表,但是当我创建数据帧并尝试输入所述列表时,我只看到一个dataframe包含空值。在

代码:

^{pr2}$

输出:

+-----------+
|Short_Title|
+-----------+
|       null|
|       null|
+-----------+

想要的输出:

+-------------+
|Short_Title  |
+-------------+
|shorttitle_1 |
|shorttitle_2 |
+-------------+

Tags: 文件数据代码标记列表titleversionxml