如何读取两个文件，插入新的列，以及计算函数，如mean，如果有空值？问题的回答

如何读取两个文件，插入新的列，以及计算函数，如mean，如果有空值？

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一个名为'test.txt'的文件，它看起来像这样： <pre><code>3.H5 5.40077 2.H8 7.75894 3.H6 7.60437 3.H5 5.40001 5.H5 5.70502 4.H8 7.55438 5.H1' 5.43574 5.H6 7.96472 "" "" "" "" "" "" 6.H6 7.96178 6.H5 5.71068 "" "" 7.H8 8.29385 7.H1' 6.01136 "" "" "" "" 8.H5 5.51053 8.H6 7.67437 </code></pre> 我想看看第一列中的值是否相同（即：如果8.H5出现了多次），如果相同，我想计算出它们的平均值。我希望我的输出如下所示： <pre><code> Atom nVa predppm avgppm stdev delta QPred QMulti qTotal 1.H1' 1 5.820 5.737 0.000 0.000 0.985 1.000 0.995 2.H1' 1 5.903 5.892 0.000 0.000 0.998 1.000 0.999 3.H1' 1 5.549 5.454 0.000 0.000 0.983 1.000 0.994 4.H1' 1 5.741 5.737 0.000 0.000 0.999 1.000 1.000 6.H1' 1 5.543 5.600 0.000 0.000 0.990 1.000 0.997 8.H1' 1 5.363 5.359 0.000 0.000 0.999 1.000 1.000 10.H1' 1 5.378 5.408 0.000 0.000 0.995 1.000 0.998 11.H1' 1 5.501 5.497 0.000 0.000 0.999 1.000 1.000 14.H1' 1 5.962 5.893 0.000 0.000 0.988 1.000 0.996 </code></pre> 现在，我的代码从<code>test.txt</code>读取并计算值的计数和平均值，并给出如下输出（<code>output.txt</code>）： <pre><code>Atom nVa avgppm 1.H1' 1 5.737 2.H1' 1 5.892 3.H1' 1 5.454 4.H1' 1 5.737 6.H1' 1 5.600 </code></pre> 但是它不考虑<code>""</code>行，如何让代码跳过有<code>""</code>行的行 我还有一个名为test2.txt的文件，如下所示： <pre><code>5.H6 7.72158 0.3 6.H6 7.70272 0.3 7.H8 8.16859 0.3 8.H6 7.65014 0.3 9.H8 8.1053 0.3 10.H6 7.5231 0.3 12.H6 7.72805 0.3 13.H6 8.02977 0.3 14.H6 7.69624 0.3 17.H8 7.24899 0.3 16.H8 8.27957 0.3 18.H6 7.6439 0.3 19.H8 7.65501 0.3 20.H8 7.78512 0.3 21.H8 8.06057 0.3 22.H8 7.47677 0.3 23.H6 7.7306 0.3 24.H6 7.80104 0.3 </code></pre> 我想读入<code>test.txt</code>的第一列的值和<code>test2.txt</code>的第一列的值，看看它们是否相同（即：如果20.H8=20.H8），如果相同，我想在<code>output.txt</code>的<code>nVa</code>列和<code>avgppm</code>列之间插入一列，然后输入<code>test2.txt</code>的值。如何通过不使用这些行，将一个列插入到输出文件中，这也解释了空白空间？ 这是我当前的代码： <pre><code>import pandas as pd import os import sys test = 'test.txt' test2 = 'test2.txt' df = pd.read_csv(test, sep = ' ', header = None) df.columns = ["Atom","ppm"] gb = (df.groupby("Atom", as_index=False) .agg({"ppm":["count","mean"]}) .rename(columns={"count":"nVa", "mean":"avgppm"})) gb.head() gb.columns = gb.columns.droplevel() gb = gb.rename(columns={"":"Atom"}) gb.to_csv("output.txt", sep =" ", index=False) df2 = pd.read_csv(test2, sep = r'/s+', header = None) df2.columns = ["Atoms","ppms","error"] shift1 = df2["Atoms"] shift2 = df2["ppms"] </code></pre> 我不太清楚该怎么办

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

如何读取两个文件，插入新的列，以及计算函数，如mean，如果有空值？

1 个回答

相关Python问题