我从事股票研究,几周前刚开始将我的市场量化模型从Excel转换为Python代码。我的主要目标是创建一个多因素模型的backtester,然后将其演化为主动定量投资组合算法
那么,我想问一下——我如何一次命名所有切片时段? 此外,我需要将每个子样本分为31个不同的时段,其中5个时段将是浮动时段,并应从网络上传。有没有一种方法可以从公司网站或其他方式解析它
目前的代码是这样的,数据集还不是很大,但稍后会添加其他部分-
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
df=pd.read_csv(r'path.csv')
print(df.tail(3))
x=df[['Date','Open','High','Low','Close']]
print(x[0:253])
x[1:254]
x[2:255]
x[3:256]
x[4:257]
x[5:258]
x[6:259]
x[7:260]
x[8:261]
x[9:262]
x[10:263]
x[11:264]
x[12:265]
x[13:266]
x[14:267]
x[15:268]
x[16:269]
x[17:270]
x[18:271]
x[19:272]
x[20:273]
x[21:274]
x[22:275]
x[23:276]
x[24:277]
x[25:278]
x[26:279]
x[27:280]
x[28:281]
x[29:282]
x[30:283]
x[31:284]
x[32:285]
x[33:286]
x[34:287]
x[35:288]
x[36:289]
x[37:290]
x[38:291]
x[39:292]
x[40:293]
x[41:294]
x[42:295]
x[43:296]
x[44:297]
x[45:298]
x[46:299]
x[47:300]
x[48:301]
x[49:302]
x[50:303]
x[51:304]
x[52:305]
x[53:306]
x[54:307]
x[55:308]
x[56:309]
x[57:310]
x[58:311]
x[59:312]
x[60:313]
x[61:314]
x[62:315]
x[63:316]
x[64:317]
x[65:318]
x[66:319]
x[67:320]
x[68:321]
x[69:322]
x[70:323]
x[71:324]
x[72:325]
x[73:326]
x[74:327]
x[75:328]
x[76:329]
x[77:330]
x[78:331]
x[79:332]
x[80:333]
x[81:334]
x[82:335]
x[83:336]
x[84:337]
x[85:338]
x[86:339]
x[87:340]
x[88:341]
x[89:342]
x[90:343]
x[91:344]
x[92:345]
x[93:346]
x[94:347]
x[95:348]
x[96:349]
x[97:350]
x[98:351]
x[99:352]
x[100:353]
x[101:354]
x[102:355]
x[103:356]
x[104:357]
x[105:358]
x[106:359]
x[107:360]
x[108:361]
x[109:362]
x[110:363]
x[111:364]
x[112:365]
x[113:366]
x[114:367]
x[115:368]
x[116:369]
x[117:370]
x[118:371]
x[119:372]
x[120:373]
x[121:374]
x[122:375]
x[123:376]
x[124:377]
x[125:378]
x[126:379]
x[127:380]
x[128:381]
x[129:382]
x[130:383]
x[131:384]
x[132:385]
x[133:386]
x[134:387]
x[135:388]
x[136:389]
x[137:390]
x[138:391]
x[139:392]
x[140:393]
x[141:394]
x[142:395]
x[143:396]
x[144:397]
x[145:398]
x[146:399]
x[147:400]
x[148:401]
x[149:402]
x[150:403]
x[151:404]
x[152:405]
x[153:406]
x[154:407]
x[155:408]
x[156:409]
x[157:410]
x[158:411]
x[159:412]
x[160:413]
x[161:414]
x[162:415]
x[163:416]
x[164:417]
x[165:418]
x[166:419]
x[167:420]
x[168:421]
x[169:422]
x[170:423]
x[171:424]
x[172:425]
x[173:426]
x[174:427]
x[175:428]
x[176:429]
x[177:430]
x[178:431]
x[179:432]
x[180:433]
x[181:434]
x[182:435]
x[183:436]
x[184:437]
x[185:438]
x[186:439]
x[187:440]
x[188:441]
x[189:442]
x[190:443]
x[191:444]
x[192:445]
x[193:446]
x[194:447]
x[195:448]
x[196:449]
x[197:450]
x[198:451]
x[199:452]
x[200:453]
x[201:454]
x[202:455]
x[203:456]
x[204:457]
x[205:458]
x[206:459]
x[207:460]
x[208:461]
x[209:462]
x[210:463]
x[211:464]
x[212:465]
x[213:466]
x[214:467]
x[215:468]
x[216:469]
x[217:470]
x[218:471]
x[219:472]
x[220:473]
x[221:474]
x[222:475]
x[223:476]
x[224:477]
x[225:478]
x[226:479]
x[227:480]
x[228:481]
x[229:482]
x[230:483]
x[231:484]
x[232:485]
x[233:486]
x[234:487]
x[235:488]
x[236:489]
x[237:490]
x[238:491]
x[239:492]
x[240:493]
x[241:494]
x[242:495]
x[243:496]
x[244:497]
x[245:498]
x[246:499]
x[247:500]
x[248:501]
x[249:502]
x[250:503]
x[251:504]
这有一个技巧,不仅命名,而且允许
[TIME]
-域中的矢量化(高效和高性能)处理算法,而不浪费任何额外的[SPACE]
-域存储,这不是一个容易同时解决的问题。如果您的数千个小数据点没有遭受这种双重麻烦,相信我,一旦您的数据集足迹增长超过几[GB]-s,您就会遭受这种双重麻烦为此,存储效率高、跨越技巧(智能间接地址映射)是最好的方法
你收到了什么
一次处理任何和所有这些(仅跨步)“切片”时段的机会,如:
您可以自由地一次处理所有“切片”时段,而无需两次存储任何重新排列的数据。这就是从一开始就专业地使用跨步技巧的力量,这是您的待设计量化建模的主要特征
所使用的QuantFX示例:
相关问题 更多 >
编程相关推荐