我收到了关于下面代码的警告。它似乎既与我插入新列的行有关,也与循环有关。我看过其他关于这个错误的帖子,但不幸的是,我是一个完全的新手,看不出我的帖子有什么问题。警告明确地说“尝试使用.loc…取而代之”,但这就是我正在做的,所以我不知道问题出在哪里
在下面的列添加和循环之前,我正在使用pycharm和数据帧的一个片段
任何帮助都将不胜感激 谢谢
import numpy as np
import pandas as pd
gdp_data = pd.read_csv("GDP Hist.csv")
# data has 2 entries per year for: total in millions & GDP per person
# removing duplicates based on years to leave only total GDP
gdp_data.drop_duplicates(subset=["LOCATION", "TIME"], inplace=True)
# Create list of unneeded columns & remove
unneeded_cols = ["INDICATOR", "SUBJECT", "MEASURE", "FREQUENCY", "Flag Codes"]
gdp_data.drop(columns=unneeded_cols, axis=1, inplace=True)
# print(gdp_data.info())
# Subset for Ireland GDP
gdp_ire = gdp_data[gdp_data['LOCATION'] == "IRL"]
gdp_ire.set_index('TIME', inplace=True)
gdp_ire['Annual%'] = np.nan # insert blank column
# loop through dataframe & calc annual % growth
for i in gdp_ire.index:
if i == 1970:
gdp_ire.loc[i, 'Annual%'] = ""
else:
gdp_ire.loc[i, 'Annual%'] = (gdp_ire.loc[i, 'Value']-gdp_ire.loc[i-1, 'Value'])/gdp_ire.loc[i-1, 'Value']*100
print(gdp_ire)
事实上,在这方面:
您正在选择全局数据帧的一部分,在下面的行中,您正在修改此子集
一个简单的解决方案是:
相关问题 更多 >
编程相关推荐