多个for循环的python方式，在每次迭代中创建新的列表，并清理数据？

>print(outputdata) [[['2.37701'], ['-'], ['-'], ['-'], ['-'], ['18.95276'], ['5.07365e-1']], [['2.75613'], ['-'], ['-'], ['-'], ['-'], ['16.99642'], ['4.10023e-1']], [['1.80527'], ['-'], ['-'], ['-'], ['-'], ['20.75384'], ['4.58238e-1']], [['1.58721'], ['-'], ['-'], ['-'], ['-'], ['18.06942'], ['3.81128e-1']], [['1.98336'], ['-'], ['-'], ['-'], ['-'], ['18.20776'], ['3.64733e-1']], [['1.75710'], ['-'], ['-'], ['-'], ['-'], ['23.03760'], ['4.36234e-1']], [['1.58967'], ['-'], ['-'], ['-'], ['-'], ['21.43884'], ['3.88509e-1']], [['2.37701'], ['-'], ['-'], ['-'], ['-'], ['18.95276'], ['5.07365e-1']]]

1条回答

网友

1楼 · 发布于 2024-10-05 19:12:52

您可以使用nested list comprehension，这似乎比使用apply的解决方案更快：

df = pd.DataFrame([[y[0] for y in x] for x in outputdata], columns=Molecule)
print (df)
        H2 Ar Methane Ethane Ethylene Propane(C3H8)   Propylene
0  2.37701  -       -      -        -      18.95276  5.07365e-1
1  2.75613  -       -      -        -      16.99642  4.10023e-1
2  1.80527  -       -      -        -      20.75384  4.58238e-1
3  1.58721  -       -      -        -      18.06942  3.81128e-1
4  1.98336  -       -      -        -      18.20776  3.64733e-1
5  1.75710  -       -      -        -      23.03760  4.36234e-1
6  1.58967  -       -      -        -      21.43884  3.88509e-1
7  2.37701  -       -      -        -      18.95276  5.07365e-1

计时：（小数据帧）

In [21]: %timeit pd.DataFrame([[y[0] for y in x] for x in outputdata], columns=Molecule)
1000 loops, best of 3: 1.04 ms per loop

In [22]: %timeit (pd.DataFrame(outputdata, columns=Molecule).apply(lambda x: x.str[0]))
100 loops, best of 3: 4.59 ms per loop

相关问题更多 >

编程相关推荐

热门问题

热门文章