Python按字符串对dat文件中的行重新排序

base = open('base8.dat', 'r') database= base.read().splitlines() base.close() counter=0 mu_list=np.array([]) delta_list=np.array([]) ofsset = 0.00136 beta=0 for PATH in database: if os.path.exists(str(PATH)+'/CHI/optimal_spectral_function_CHI.dat'): n1_array = numpy.loadtxt(str(PATH)+'/AVERAGES/av-err.n.dat') n7_array= numpy.loadtxt(str(PATH)+'/AVERAGES/av-err.npx.dat') n1_mean = n1_array[0] delta=round(float(5.0+ofsset-(n1_array[0]*2.+4.*n7_array[0])),6) par = open(str(PATH)+"/params10", "r") for line in par: counter= counter+1 if re.match("mu", line): mioMU= re.findall('\d+', line.translate(None, ';')) mioMU2=line.split()[2][:-1] mu=mioMU2 print mu, delta, PATH mu_list=np.append(mu_list, mu) delta_list=np.append(delta_list,delta) optimal_counter=0 print delta_list, mu_list

1条回答

网友

1楼 · 发布于 2024-09-22 20:30:48

假设行的数字部分是浮点数的形式，可以使用正则表达式匹配该部分，并将其从字符串转换为浮点数。你知道吗

之后，可以使用此信息对从文件中读取的所有行进行排序。我添加了一个无效行，以显示如何处理无效数据。你知道吗

作为一个简单的例子，我建议如下：

import re

# TODO: Read file and get list of lines

l = ['Volumes/hard_disc/u14_cut/u14**m12.40**_all.beta/beta8',
    'Volumes/hard_disc/u14_cut/u14**m12.50**_all.beta/beta8',
    'Volumes/hard_disc/u14_cut/u14**m11.40**_all.beta/beta8',
    'Volumes/hard_disc/u14_cut/u14**mm11.40**_all.beta/beta8']

regex = r'^.+\*{2}m{1}(?P<criterion>[0-9\.]*)\*{2}.+$'
p = re.compile(regex)

criterion_list = []

for s in l:
    m = p.match(s)
    if m:
        crit = m.group('criterion')
        try:
            crit = float(crit)
        except Exception as e:
            crit = 0
    else:
        crit = 0
    criterion_list.append(crit)


tuples_list = list(zip(criterion_list, l))
output = [element[1] for element in sorted(tuples_list, key=lambda t: t[0])]
print(output)

# TODO: Write output to new file or overwrite existing one.

给予：

['Volumes/hard_disc/u14_cut/u14**mm11.40**_all.beta/beta8', 'Volumes/hard_disc/u14_cut/u14**m11.40**_all.beta/beta8', 'Volumes/hard_disc/u14_cut/u14**m12.40**_all.beta/beta8', 'Volumes/hard_disc/u14_cut/u14**m12.50**_all.beta/beta8']

从文件中读取所有行并将其存储到一个列表（这里称为l的列表）之后，这个代码段就开始了。regex组criterion捕获**m12.50**中包含的浮点部分，正如您在regex101上看到的那样。因此，遍历所有行会得到一个新列表，其中包含所有匹配的组作为float。如果正则表达式在给定字符串上不匹配或将组转换为浮点失败，crit被设置为零，以便以后在排序列表的最开始处有那些无效的行。你知道吗

之后，使用zip()获得包含提取的浮点和相应字符串的tule列表。现在可以根据元组的第一个元素对元组列表进行排序，并根据新列表output编写相应的字符串。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章