比较两个csv文件，如果两个字段之间存在匹配，请执行某些操作

for rowst in student: for rowtu in tutor: if rowst['RegGroup'][-3:] in rowtu['StaffCode']: print (rowst['RegGroup'][-3:],rowtu['StaffCode']) print("----------------------------------------")

2条回答

网友

1楼 · 编辑于 2024-10-04 01:24:04

dictReader是一个迭代器，它遍历文件一次，在读取一次文件后必须重新启动。在

下面是一个代码示例，它很有用，但并不十分优雅：

with open("tutor.csv") as stu:
    student = csv.DictReader(stu)
    for rowst in student:
        with open("student.csv") as tu:
            tutor = csv.DictReader(tu)
            for rowtu in tutor:
                if rowst['RegGroup'][-3:] in rowtu['StaffCode']:
                    print (rowst['RegGroup'][-3:],rowtu['StaffCode'])
                    print("                    ")

“with open…”一行创建了一个上下文，在该上下文中文件可用，然后自动关闭。但是对于大文件，这不是您想要重复的，您应该将数据存储在适当的对象中。在

为此，您可以使用numpy.loadtxt之类的东西。在

网友

2楼 · 编辑于 2024-10-04 01:24:04

程序试图比较中的每一行中的值学生.csv与导师.csv. 但是，我从您需要的理解是加入StaffCode列上的两个数据集。因此，常规的csv读写可能很难做到，我建议使用熊猫，这将有助于。这是密码。

import pandas as pd
stu = pd.read_csv('./data/students.csv')
tutors = pd.read_csv('./data/tutors.csv')
stu.head()
Out[19]: 
  RegGroup
0    XXFLI
1    XXRTH
2    XXPOD
3    XXDFI
4    XXLNO
tutors.head() # i added a column as 'Staff Name' for fun
Out[20]: 
  StaffCode  Staff Name
0       FLI      Fly Li
1       RTH      Ruth G
2       POD     Podrick
3       DFI   Daren Fli
4       LNO      Lenord
# extract the last three characters as 'StaffCode'
stu['StaffCode'] = stu.apply(lambda row: row['RegGroup'][-3:], axis=1)
stu.head()
Out[22]: 
  RegGroup StaffCode
0    XXFLI       FLI
1    XXRTH       RTH
2    XXPOD       POD
3    XXDFI       DFI
4    XXLNO       LNO
stu_new = pd.merge(stu, tutors, how='left', on=['StaffCode']) # merge it on the StaffCode column and do some cool stuff
stu_new.head()
Out[24]: 
  RegGroup StaffCode  Staff Name
0    XXFLI       FLI      Fly Li
1    XXRTH       RTH      Ruth G
2    XXPOD       POD     Podrick
3    XXDFI       DFI   Daren Fli
4    XXLNO       LNO      Lenord

只是代码

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章