我有一系列天文观测数据,这些数据被放在每个观测年的程序生成的数据框中(即df2015、df2016等),这些数据框需要在后续过程中进行修改,我把它们都放在了列表中。用于定义列表的方法会有所不同。显式定义列表
dfs = [df2015, df2016, df2017, df2018, df2019]
允许对df进行进一步修改,但这与代码的目的不符——自动处理标准数据集,而不考虑年限。程序生成的列表
for yr in years:
exec('dfs = [df' + yr + ' for yr in years]')
似乎大部分时间都在工作,比如:
for df in dfs:
dfX = df.dtypes
for index, val2 in dfX.items():
if val2 == 'float64':
df.iloc[:,index] = df.iloc[:,index].fillna(0).astype('int64')
,但在某些情况下失败,如:
for df in dfs:
i=1
for i in range(1, 13):
ncol = i + (i-1) *2
if i < 10:
nmon = '0' + str(i)
else:
nmon = '' + str(i)
df.insert(ncol, 'M' + nmon, nmon)
i += 1
当带有insert语句的for循环导致错误时:
ValueError: cannot insert M01, already exists
我尝试过列表理解而不是for循环,尝试过改变循环嵌套顺序(以防万一)等等
上述参考步骤的目的是将其转换为:
0 1 2 3 4 5 6 7 8 9 ... 15 16 17 18 19 20 21 22 23 24
0 1 713 1623 658.0 1659.0 619 1735 526.0 1810.0 439 ... 437 1903 510.0 1818.0 542 1725 618.0 1637.0 654 1613
1 2 714 1624 657.0 1700.0 618 1736 525.0 1812.0 438 ... 438 1902 511.0 1816.0 543 1724 619.0 1636.0 655 1613
2 3 714 1625 655.0 1702.0 616 1737 523.0 1813.0 437 ... 439 1901 512.0 1814.0 544 1722 620.0 1635.0 656 1612
3 4 714 1626 654.0 1703.0 614 1738 521.0 1814.0 435 ... 440 1900 513.0 1813.0 545 1720 622.0 1634.0 657 1612
4 5 713 1627 653.0 1704.0 613 1739 520.0 1815.0 434 ... 441 1859 514.0 1811.0 546 1719 623.0 1633.0 658 1612
在这里
0 M01 D01 1 2 M02 D02 3 4 M03 ... 19 20 M11 D11 21 22 M12 D12 23 24
0 1 01 1 713 1623 02 1 658 1659 03 ... 542 1725 11 1 618 1637 12 1 654 1613
1 2 01 2 714 1624 02 2 657 1700 03 ... 543 1724 11 2 619 1636 12 2 655 1613
2 3 01 3 714 1625 02 3 655 1702 03 ... 544 1722 11 3 620 1635 12 3 656 1612
3 4 01 4 714 1626 02 4 654 1703 03 ... 545 1720 11 4 622 1634 12 4 657 1612
4 5 01 5 713 1627 02 5 653 1704 03 ... 546 1719 11 5 623 1633 12 5 658 1612
创建去年数据帧的副本列表。如果您的年份列表是
['2015', '2016', '2017', '2018']
,那么您将生成一个dfs作为[df2018, df2018, df2018, df2018]
,这将导致错误。你知道吗这将得到正确的结果:
它形成所需的数据帧名称,并对其求值,以便获得数据帧列表。你知道吗
我相信你们每年都在编制一份重复的清单。你知道吗
列表理解中的yr由for块迭代,这意味着列表理解中的
for yr in years
只需为与原始列表years
中相同的项目编写表示df的字符串。这将导致在重复字符串列表上循环,并尝试将列插入到您刚刚插入这些列的数据帧中。相反,尝试不使用for循环的列表理解。你知道吗dfs = ['df' + str(yr) for yr in years]
相关问题 更多 >
编程相关推荐