我试图抓住回复文本的内容,即日期。但是,如果它不是一个日期,它不应该抓取内容。有人能帮帮我吗。。 我当前的正则表达式是:“续订/到期日期:[^\d]([\d/])”
<div class="textbkStyle">Renewal/Expiration Date:
<div class="responseText">
01/01/2019
</div>
</div>
问题是如果xml看起来像这样
<div class="textbkStyle">Renewal/Expiration Date:
<div class="responseText">
NOT AVAILABLE
</div>
</div>
它将跳转不可用的文本,并获取页面中与格式匹配的另一个连续日期。此外,建议资源,以更好地在正则表达式也表示感谢。你知道吗
尽管你不应该这样做,但以下是你可以做到的:
您的日期将在
\1
https://regex101.com/r/7Yn7zk/1
Regex不是最好的工具。我会使用html解析器。示例BeautifulSoup:
pip install beautifulsoup4
和do或函数:
相关问题 更多 >
编程相关推荐