我试图从monthly_return
数据框中找出每个月回报率最高的前三只股票
结果应该如下所示:
数据:
!curl -L -s -o open_price.csv https://drive.google.com/uc?id=1eClVnVMMgw5bIFJ8sMS8h4d5Msj5gyKo
!curl -L -s -o low_price.csv https://drive.google.com/uc?id=1yRafpOnVQbCGUKq5YnIfXTZisCJQ386x
!curl -L -s -o high_price.csv https://drive.google.com/uc?id=1Kpwh_EgwjpSsFXojLrPvznmyl7z9_afk
!curl -L -s -o close_price.csv https://drive.google.com/uc?id=1IF96oVlbz1wOOKrcYbT7J1P6UCxVa5XI
!curl -L -s -o adj_close_price.csv https://drive.google.com/uc?id=1CjlEcxZkzYrNbqNQHPwLlAEvciEmtTF2
!ls
1。任务1
导入5.csv文件并相应地命名生成的数据帧open_price
、low_price
、high_price
、close_price
和adj_close_price
我的答覆是:
open_price = pd.read_csv("open_price.csv")
low_price = pd.read_csv("low_price.csv")
high_price = pd.read_csv("high_price.csv")
close_price = pd.read_csv("close_price.csv")
adj_close_price = pd.read_csv("adj_close_price.csv")
2。任务2
将5个数据帧重新整形并组合为1个具有以下格式的数据帧(命名为price
)
open_price_melted = pd.melt(open_price,id_vars="Date",var_name="Symbol",value_name="Open")
high_price_melted = pd.melt(high_price,id_vars="Date",var_name="Symbol",value_name="High")
low_price_melted = pd.melt(open_price,id_vars="Date",var_name="Symbol",value_name="Low")
close_price_melted = pd.melt(close_price,id_vars="Date",var_name="Symbol",value_name="Close")
adj_close_price_melted = pd.melt(adj_close_price,id_vars="Date",var_name="Symbol",value_name="Adj Close")
melted_df = [open_price_melted,high_price_melted.loc[:,[False,False,True]],low_price_melted.loc[:,[False,False,True]],close_price_melted.loc[:,[False,False,True]],adj_close_price_melted.loc[:,[False,False,True]]]
price = pd.concat(melted_df,join="inner",axis=1)
任务3
接下来,使用调整后的收盘价(第^{
为了计算月度股票收益率,我们需要将月末调整后的收盘价与月初调整后的收盘价进行比较。回报率的计算公式是将最后一天的价格除以一个月内第一天的价格。然后从该结果中减去数字1。您可以将结果保留为十进制格式。命名结果DataFrame
{
我的答案(我还没有真正完成这一个,因为我不知道如何1)删除月份文本和2)删除符号文本
stock = close_price
stock["Month"] = close_price["Date"].apply(lambda x: x[0:7])
stock_1 = pd.melt(stock, id_vars=["Date","Month"], var_name="Symbol", value_name="Adj Close")
stock_1_grp = stock_1.groupby(["Month","Symbol"])
stock_2 = stock_1_grp.agg([("", lambda x: x.iloc[len(x)-1]/x.iloc[0]-1)])
stock_2_pivot = pd.pivot_table(stock_2,values="Adj Close", index="Month", columns="Symbol")
stock_2_pivot.sort_index(axis=1)
stock_2_pivot.reset_index()
monthly_return = stock_2_pivot.iloc[1:36,0:]
monthly_return.reset_index()
任务4[主要问题]根据月度回报率,找出每个月回报率最高的前3只股票。结果应如下所示:
对于任务3、任务4或我的任何错误代码的任何帮助和建议,我们将不胜感激
你必须先去掉多重索引,我想应该是这样的:
处理此类数据的一种更简单的方法是长轴心、排序并取前N,因此我们将其包装到一个函数中,以防止数据帧过度填充环境。。(我不知道你有多少……):
然后我们做:
相关问题 更多 >
编程相关推荐