Python长xml.HMTLXpath返回空Lis

filing_dates_pg = requests.get('http://csuite.xbrl.us/php/dispatch.php?Task=xbrlValues&Element=NetCashProvidedByUsedInOperatingActivitiesContinuingOperations&CIK=0001228627&Ultimus=true&DimReqd=false&API_Key=xxxx') # The URL easiest to read in FIREFOX Browser. Datestree = html.fromstring(filing_dates_pg.text) date_list = Datestree.xpath('//periodStart/text()') filing_type_list = Datestree.xpath('//period/text()') ocf = Datestree.xpath('//amount/text()') print ocf # Works, list matches data in URL page print filing_type_list # Works print type(date_list) print date_list # Does NOT work

2条回答

网友

1楼 · 编辑于 2024-09-28 14:58:18

似乎您使用的是lxml.html.fromstring而不是lxml.etree.fromstring。在

使用lxml.etree.fromstring。否则，您需要指定//periodstart/text()xpath表达式（全部小写），因为在HTML中标记名不区分大小写。在

from lxml import etree

...

Datestree = etree.fromstring(filing_dates_pg.text)

网友

2楼 · 编辑于 2024-09-28 14:58:18

我在实施过程中也面临这个问题。在

解析期间html.fromstring将标记名和属性名转换为小写

使用方法如下：

>> Datestree.xpath('//periodstart//text()')

或者也可以由falsetru使用etree

相关问题更多 >

编程相关推荐

热门问题

热门文章