如何用lxm解析html

2条回答

网友

1楼 · 编辑于 2024-09-30 20:39:05

问题在于检查bordR类的方式。class是一个以空格分隔的多值属性，您必须考虑元素上的其他类。在XPath中，应该使用“contains”：

.//td[contains(@class, 'bordR')]

或者，更可靠的是add "concat" to the partial match check。在

找到元素后，可以使用.text_content()方法获取包含所有子元素的完整文本：

^{pr2}$

要进一步，您可以load the date string into a ^{} object：

In [5]: from datetime import datetime
In [6]: datetime.strptime(td.text_content(), "%d.%m.%Y, %a|%H:%M")
Out[6]: datetime.datetime(2016, 10, 13, 17, 0)

网友

2楼 · 编辑于 2024-09-30 20:39:05

有一个名为^{}的方法：

Iterates over the text content of a subtree.

因此，如果变量td中有一个元素td，可以这样做：

>>> text = list(td.itertext()); text
['13.10.2016, Thu', '|', '17:00']

>>> date, time = text[0].split(',')[0], text[-1]

>>> datetime_text = '{} at {}'.format(date, time)

>>> datetime_text
'13.10.2016 at 17:00'

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何用lxm解析html

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >