将KML文件转换为CSV，并在rgdal和sf包以及Python中出现错误

library(rgdal) allKmlLayers <- function(kmlfile){ lyr <- ogrListLayers(kmlfile) mykml <- list() for (i in 1:length(lyr)){ mykml[i] <- readOGR(kmlfile, lyr[i]) } names(mykml) <- lyr return(mykml) } kmlfile <- "Distilleries and Hospitals.kml" mykml <- allKmlLayers(kmlfile)

<?xml version="1.0" encoding="UTF-8"?> <kml xmlns="http://www.opengis.net/kml/2.2"> <Document> <Folder> <name>Distilleries</name> <Placemark> <name>Bomb City Enterprises</name> <description><![CDATA[Address: 306 S Cleveland St Address Line2: City: Amarillo Location: Alabama State_Abbrev: AL Postal Code: 79102 unnamed (1): unnamed (2): unnamed (3): Updated 2020-04-12 20:30:13.383810: ]]></description> <ExtendedData> <Data name="Address"> <value>306 S Cleveland St</value> </Data> <Data name="Address Line2"> <value/> </Data> <Data name="City"> <value>Amarillo</value> </Data> <Data name="Location"> <value>Alabama</value> </Data> <Data name="State_Abbrev"> <value>AL</value> </Data> <Data name="Postal Code"> <value>79102</value> </Data> <Data name="unnamed (1)"> <value/> </Data> <Data name="unnamed (2)"> <value/> </Data> <Data name="unnamed (3)"> <value/> </Data> <Data name="Updated 2020-04-12 20:30:13.383810"> <value/> </Data> </ExtendedData> </Placemark> <Placemark> <name>Cahaba Brewing Company</name> <address>4500 5th Ave. S building C Birmingham Alabama AL 35222</address> <description><![CDATA[Address: 4500 5th Ave. S Address Line2: building C City: Birmingham Location: Alabama State_Abbrev: AL Postal Code: 35222 unnamed (1): unnamed (2): unnamed (3): Updated 2020-04-12 20:30:13.383810: ]]></description> <styleUrl>#icon-1517-0288D1</styleUrl> <ExtendedData> <Data name="Address"> <value>4500 5th Ave. S</value> </Data> <Data name="Address Line2"> <value>building C</value> </Data> <Data name="City"> <value>Birmingham</value> </Data> <Data name="Location"> <value>Alabama</value> </Data> <Data name="State_Abbrev"> <value>AL</value> </Data> <Data name="Postal Code"> <value>35222</value> </Data> <Data name="unnamed (1)"> <value/> </Data> <Data name="unnamed (2)"> <value/> </Data> <Data name="unnamed (3)"> <value/> </Data> <Data name="Updated 2020-04-12 20:30:13.383810"> <value/> </Data> </ExtendedData> </Placemark> <Placemark> <name>Redmont Distilling Company</name> <address>4550 5th Ave South building N Birmingham Alabama AL 35222</address> <description><![CDATA[Address: 4550 5th Ave South Address Line2: building N City: Birmingham Location: Alabama State_Abbrev: AL Postal Code: 35222 unnamed (1): unnamed (2): unnamed (3): Updated 2020-04-12 20:30:13.383810: ]]></description> <styleUrl>#icon-1517-0288D1</styleUrl> <ExtendedData> <Data name="Address"> <value>4550 5th Ave South</value> </Data> <Data name="Address Line2"> <value>building N</value> </Data> <Data name="City"> <value>Birmingham</value> </Data> <Data name="Location"> <value>Alabama</value> </Data> <Data name="State_Abbrev"> <value>AL</value> </Data> <Data name="Postal Code"> <value>35222</value> </Data> <Data name="unnamed (1)"> <value/> </Data> <Data name="unnamed (2)"> <value/> </Data> <Data name="unnamed (3)"> <value/> </Data> <Data name="Updated 2020-04-12 20:30:13.383810"> <value/> </Data> </ExtendedData> </Placemark> <Placemark>

import xml.etree.ElementTree as et doc = et.parse(filename) nmsp = '{http://www.opengis.net/kml/2.2}' name = [] address1 = [] for pm in doc.iterfind('.//{0}Placemark'.format(nmsp)): print(pm.find('{0}name'.format(nmsp)).text) name.append(pm.find('{0}name'.format(nmsp)).text) for adr1 in pm.iterfind('{0}ExtendedData//{0}value'.format(nmsp)): address1.append(adr1.text.strip().replace('\n','')) print(adr1.text.strip().replace('\n',''))

1条回答

网友

1楼 · 发布于 2024-09-29 23:23:24

由于KML文件是XML文件，请考虑XSLT，专门用于将XML文件转换成不同的XML、HTML、甚至CSV格式的专用语言。p>

带有lxml模块的Python和带有xslt（扩展包到xml2）模块的R都可以运行XSLT1.0脚本

XSLT（另存为.xsl，一个特殊的.xml文件）

<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
                              xmlns:doc="http://www.opengis.net/kml/2.2">
  <xsl:output indent="yes" method="text" encoding="UTF-8"/>
  <xsl:strip-space elements="*"/>

  <xsl:template match="/doc:kml">
    <xsl:copy>
      <xsl:text>Name,Address 1,Address 2,City,State,Zip&#xa;</xsl:text>
      <xsl:apply-templates select="descendant::doc:Placemark"/>
    </xsl:copy>
  </xsl:template>

  <xsl:template match="doc:Placemark">
    <xsl:copy>
      <xsl:value-of select="concat(doc:name, ',',
                                   doc:ExtendedData/doc:Data[@name='Address'], ',',
                                   doc:ExtendedData/doc:Data[@name='Address Line2'], ',',
                                   doc:ExtendedData/doc:Data[@name='City'], ',',
                                   doc:ExtendedData/doc:Data[@name='Location'], ',',
                                   doc:ExtendedData/doc:Data[@name='Postal Code'])"/>
      <xsl:text>&#xa;</xsl:text>
    </xsl:copy>
  </xsl:template>

</xsl:stylesheet>

`Online Demo`

Python

import lxml.etree as et

# INPUT XML AND XSL SOURCES
xml = et.parse('/path/to/Input.kml')
xsl = et.parse('/path/to/Script.xsl')

# RUN TRANSFORMATION
transformer = et.XSLT(xsl)
new_xml = transformer(xml)

# PRINT TO CONSOLE
print(new_xml)
# Name,Address 1,Address 2,City,State,Zip
# Bomb City Enterprises,306 S Cleveland St,,Amarillo,Alabama,79102
# Cahaba Brewing Company,4500 5th Ave. S,building C,Birmingham,Alabama,35222
# Redmont Distilling Company,4550 5th Ave South,building N,Birmingham,Alabama,35222

# SAVE TO FILE
with open('/path/to/Output.csv', 'wb') as f:
   f.write(new_xml)

library(xml2)
library(xslt)

# PARSE XML AND XSLT
doc <- read_xml('/path/toInput.kml')
style <- read_xml('/path/to/Script.xsl', package = "xslt")

# TRANSFORM NESTED INPUT INTO FLATTER OUTPUT
new_xml <- xslt::xml_xslt(doc, style)

# SAVE CSV
f <- file("/path/to/Output.csv")
    writeLines(new_xml, f)
close(f)

# BUILD DATA FRAME
final_df <- read.csv('/path/to/Output.csv')

#                         Name          Address.1  Address.2       City   State   Zip
# 1      Bomb City Enterprises 306 S Cleveland St              Amarillo Alabama 79102
# 2     Cahaba Brewing Company    4500 5th Ave. S building C Birmingham Alabama 35222
# 3 Redmont Distilling Company 4550 5th Ave South building N Birmingham Alabama 35222

`Online Demo`

相关问题更多 >

编程相关推荐

热门问题

热门文章