大Pandas大数据集的数据类型变化

2024-09-29 01:27:45 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我使用pandas从CSV文件创建一个数据帧,并且我有一个数据类型为datetime的列。对于较小的数据集,这与预期的一样有效。如果数据集很大,我对该列执行的操作将其更改为对象而不是datatime。有没有办法保存数据类型?我试着在数据帧中使用iloc或ix,但没用。下面是我的一些代码和问题所在。在

twitterDataFrame['CreatedAt'] = twitterDataFrame['CreatedAt'].map(lambda x: pandas.to_datetime(x))
twitterDataFrame['CreatedAtForCalculations'] = twitterDataFrame['CreatedAt']

问题出现在下一组代码的第3行。它抱怨tweetsByEachUser['CreatedAtForCalculations'].first()和{}是字符串,无法计算字符串的求反。在

^{pr2}$

我试过了

twitterDataFrame.ix['CreatedAtForCalculations':].dtypes

但这也行不通。有人知道解决这个问题的办法吗?在

数据样本测向信息在

  Int64Index: 21836 entries, 0 to 21835
  Data columns (total 17 columns):
  CreatedAt                   21836 non-null object
  ActualTweet                 21836 non-null object
  InReplyToStatusID           21836 non-null bool
  InReplyToUserID             21836 non-null bool
  UserID                      21836 non-null object
  RetweetCount                21836 non-null object
  FavouriteCount              21836 non-null object
  Hashtags                    21836 non-null bool
  URL                         21836 non-null bool
  MediaURL                    21836 non-null bool
  MediaType                   21836 non-null object
  UserMentionID               21836 non-null bool
  PossiblySensitive           21836 non-null object
  Language                    21836 non-null object
  Classifier                  21836 non-null object
  TweetLength                 21836 non-null object
  CreatedAtForCalculations    21836 non-null object
  dtypes: bool(6), object(11)None

谢谢:)


Tags: to数据代码pandasdatetimeobjectnullbool