所以我使用pandas从CSV文件创建一个数据帧,并且我有一个数据类型为datetime的列。对于较小的数据集,这与预期的一样有效。如果数据集很大,我对该列执行的操作将其更改为对象而不是datatime。有没有办法保存数据类型?我试着在数据帧中使用iloc或ix,但没用。下面是我的一些代码和问题所在。在
twitterDataFrame['CreatedAt'] = twitterDataFrame['CreatedAt'].map(lambda x: pandas.to_datetime(x))
twitterDataFrame['CreatedAtForCalculations'] = twitterDataFrame['CreatedAt']
问题出现在下一组代码的第3行。它抱怨tweetsByEachUser['CreatedAtForCalculations'].first()
和{
我试过了
twitterDataFrame.ix['CreatedAtForCalculations':].dtypes
但这也行不通。有人知道解决这个问题的办法吗?在
数据样本测向信息在
Int64Index: 21836 entries, 0 to 21835
Data columns (total 17 columns):
CreatedAt 21836 non-null object
ActualTweet 21836 non-null object
InReplyToStatusID 21836 non-null bool
InReplyToUserID 21836 non-null bool
UserID 21836 non-null object
RetweetCount 21836 non-null object
FavouriteCount 21836 non-null object
Hashtags 21836 non-null bool
URL 21836 non-null bool
MediaURL 21836 non-null bool
MediaType 21836 non-null object
UserMentionID 21836 non-null bool
PossiblySensitive 21836 non-null object
Language 21836 non-null object
Classifier 21836 non-null object
TweetLength 21836 non-null object
CreatedAtForCalculations 21836 non-null object
dtypes: bool(6), object(11)None
谢谢:)
目前没有回答
相关问题 更多 >
编程相关推荐