pandas将字符串列转换为datetime，允许缺失但不无效问题的回答

pandas将字符串列转换为datetime，允许缺失但不无效

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一个<code>pandas</code>数据框，其中有多列表示日期的字符串，空字符串表示丢失的日期。例如 <pre><code>import numpy as np import pandas as pd # expected date format is 'm/%d/%Y' custId = np.array(list(range(1,6))) eventDate = np.array(["06/10/1992","08/24/2012","04/24/2015","","10/14/2009"]) registerDate = np.array(["06/08/2002","08/20/2012","04/20/2015","","10/10/2009"]) # both date columns of dfGood should convert to datetime without error dfGood = pd.DataFrame({'custId':custId, 'eventDate':eventDate, 'registerDate':registerDate}) </code></pre> 我想： <ul> <li>有效地将所有字符串都是有效日期或为空的列转换为<code>datetime64</code>类型的列（对于空的，<code>NaT</code>为空）</li> <li>当任何非空字符串不符合预期格式时引发<code>ValueError</code></li> </ul> 应在何处引发<code>ValueError</code>的示例： ^{pr2}$ 此函数在元素级别执行我想要的操作： <pre><code>from datetime import datetime def parseStrToDt(s, format = '%m/%d/%Y'): """Parse a string to datetime with the supplied format.""" return pd.NaT if s=='' else datetime.strptime(s, format) print(parseStrToDt("")) # correctly returns NaT print(parseStrToDt("12/31/2011")) # correctly returns 2011-12-31 00:00:00 print(parseStrToDt("12/31/11")) # correctly raises ValueError </code></pre> 但是，我有一个<a href="https://stackoverflow.com/questions/8089940/applying-string-operations-to-numpy-arrays">read</a>字符串操作不应该是<code>np.vectorize</code>-d。我认为使用<code>pandas.DataFrame.apply</code>可以有效地实现这一点，如： <pre><code>dfGood[['eventDate','registerDate']].applymap(lambda s: parseStrToDt(s)) # raises TypeError dfGood.loc[:,'eventDate'].apply(lambda s: parseStrToDt(s)) # raises same TypeError </code></pre> 我猜<code>TypeError</code>与我的函数返回一个不同的<code>dtype</code>有关，但我确实想利用动态类型并用日期时间替换字符串（除非ValueError被引发）。。。那我该怎么做呢？在

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

pandas将字符串列转换为datetime，允许缺失但不无效

1 个回答

相关Python问题