从txt文件中读取行并创建一个字典，其中值是元组列表

Akçam Su Tilsim PSYC 3.9 Aksel Eda POLS 2.78 Alpaydin Dilay ECON 1.2 Atil Turgut Uluç IR 2.1 Deveci Yasemin PSYC 2.9 Erserçe Yasemin POLS 3.0 Gülle Halil POLS 2.7 Gündogdu Ata Alp ECON 4.0 Gungor Muhammed Yasin POLS 3.1 Hammoud Rawan IR 1.7 Has Atakan POLS 1.97 Ince Kemal Kahriman IR 2.0 Kaptan Deniz IR 3.5 Kestir Bengisu IR 3.8 Koca Aysu ECON 2.5 Kolayli Sena Göksu IR 2.8 Kumman Gizem PSYC 2.9 Madenoglu Zeynep PSYC 3.1 Naghiyeva Gulustan IR 3.8 Ok Arda Mert IR 3.2 Var Berna ECON 2.9 Yeltekin Sude PSYC 1.2

def read_student(ifile): D={} f1=open(ifile,'r') for line in f1: tab=line.find('\t') space=line.rfind(' ') rtab=line.rfind('\t') student_surname=line[0:tab] gpa=line[space+1:] department=line[rtab+1:space] if department not in D: D[department]=[(student_surname,gpa)] else: D[department].append((student_surname,gpa)) f1.close() return D print(read_student('student.txt'))

3条回答

网友

1楼 · 编辑于 2024-09-29 06:32:31

当你可以简单地split时，为什么还要处理rfind和find呢

def read_student(ifile):
    D = {}
    f1 = open(ifile,'r')
    for line in f1:
        cols = line.split() # Splits at one or more whitespace
        surname = cols[0].strip()
        department = cols[-2].strip() # Because you know the last-but-one is dept
        gpa = float(cols[-1].strip()) # Because you know the last one is GPA
        fname = ' '.join(cols[1:-2]).strip() 
        # cols[1:-2] gives you everything starting at col 1 up to but excluding the second-last. 
        # Then you join these with spaces.


        if department not in D:
            D[department] = [(surname, gpa)]
        else:
            D[department].append((surname, gpa))

    f1.close()
    return D

如果您知道您的列总是由\t分隔，那么您可以改为使用cols = line.split('\t')。第二栏是学生的名字，第三栏是系，第四栏是GPA

有几点建议：

您可以使用defaultdict来避免每次检查if department not in D
您可以使用with来管理文件的读取，这样就不必担心f1.close()。这是在Python中读取文件的首选方法

网友

2楼 · 编辑于 2024-09-29 06:32:31

见下文-您必须注意姓氏，但问题中的其他细节已处理完毕

from collections import defaultdict

data = defaultdict(list)
with open('data.txt', encoding="utf-8") as f:
    lines = [l.strip() for l in f.readlines()]
    for line in lines:
        first_space_idx = line.rfind(' ')
        sec_space_idx = line.rfind(' ', 0,first_space_idx - 1)
        grade = line[first_space_idx+1:]
        dep = line[sec_space_idx:first_space_idx]
        student = line[:sec_space_idx].strip()
        data[dep].append((student, grade))
for dep, students in data.items():
    print(f'{dep} --> {students}')

输出

 PSYC --> [('Akçam   Su Tilsim', '3.9'), ('Deveci  Yasemin', '2.9'), ('Kumman  Gizem', '2.9'), ('Madenoglu Zeynep', '3.1'), ('Yeltekin Sude', '1.2')]
 POLS --> [('Aksel   Eda', '2.78'), ('Erserçe Yasemin', '3.0'), ('Gülle   Halil', '2.7'), ('Gungor  Muhammed Yasin', '3.1'), ('Has Atakan', '1.97')]
 ECON --> [('Alpaydin Dilay', '1.2'), ('Gündogdu Ata Alp', '4.0'), ('Koca    Aysu', '2.5'), ('Var Berna', '2.9')]
 IR --> [('Atil    Turgut Uluç', '2.1'), ('Hammoud  Rawan', '1.7'), ('Ince    Kemal Kahriman', '2.0'), ('Kaptan  Deniz', '3.5'), ('Kestir  Bengisu', '3.8'), ('Kolayli Sena Göksu', '2.8'), ('Naghiyeva Gulustan', '3.8'), ('Ok  Arda Mert', '3.2')]

网友

3楼 · 编辑于 2024-09-29 06:32:31

您可以使用split(' ', 1)提取姓氏。它给出了包含两个元素的列表。第一个是姓氏。然后再次使用rsplit(' ', 1)分割第二个元素以获得结果。它再次给出了包含两个元素的列表，第一个元素是name和dept，第二个元素是gpa。再次使用瞬间元素获取部门

def read_student(ifile):
    d = {}
    with open(ifile) as fp:
      for line in fp:
          fname, data = line.strip().split(' ', 1)
          data, gpa = data.rsplit(' ', 1)
          dept = data.split()[-1]
          d.setdefault(dept, []).append((fname, gpa))
      return d

print(read_student('student.txt'))

输出：

{'ECON': [('Alpaydin', '1.2'),
          ('Gündogdu', '4.0'),
          ('Koca', '2.5'),
          ('Var', '2.9')],
 'IR': [('Atil', '2.1'),
        ('Hammoud', '1.7'),
        ('Ince', '2.0'),
        ('Kaptan', '3.5'),
        ('Kestir', '3.8'),
        ('Kolayli', '2.8'),
        ('Naghiyeva', '3.8'),
        ('Ok', '3.2')],
 'POLS': [('Aksel', '2.78'),
          ('Erserçe', '3.0'),
          ('Gülle', '2.7'),
          ('Gungor', '3.1'),
          ('Has', '1.97')],
 'PSYC': [('Akçam', '3.9'),
          ('Deveci', '2.9'),
          ('Kumman', '2.9'),
          ('Madenoglu', '3.1'),
          ('Yeltekin', '1.2')]}

相关问题更多 >

编程相关推荐

热门问题

热门文章