给定一个带有未知格式的日期和其他文本的字符串,如何将两者分开?在
>>dparser.parse("monkey 2010-07-10 love banana",fuzzy=True)
datetime.datetime(2010, 7, 10, 0, 0)
fromExtracting date from a string in Python是朝正确方向迈出的一步,但我想要的是非日期文本,例如:
^{pr2}$如果日期字符串中没有空格,我可以拆分字符串并测试每个子字符串,但是'monkey Feb 20, 2015 loves 2014 bananas'
怎么样?2014
和2015
都将“pass”parse(),但其中只有一个是日期的一部分。在
编辑:似乎没有任何合理的方法来处理'monkey Feb 20, 2015 loves 2014 bananas'
留下{
要在自然语言文本中查找日期/时间并返回它们在输入文本中的位置,从而允许获取非日期文本:
输出
^{pr2}$注意:}在两个字符串中都被识别为时间(})。在
parsedatetime
无法将2010-07-10
识别为第一个字符串中的日期。2010
和{20:10
和{您可以使用regex来提取单词,对于get-ride-of-month名称,您可以检查字符串是否不在
calendar.month_abbr
和calendar.month_name
中:演示:
^{pr2}$还有这个:
^{3}$相关问题 更多 >
编程相关推荐