Python比较CSV-fi的值

1条回答

网友

1楼 · 发布于 2024-09-21 10:58:15

我不知道你想要什么。但是你尝试了什么？你在等我们做作业吗？这就是这个问题被否决的原因吗？在

无论如何，我可能会从类似的东西开始，尽管这既没有优化内存也没有优化CPU。如果您的数据集有无数行，这将不适合。在

算法： 1保留“start”和“end”的所有不同值； 2当“开始”和“结束”相同时，保持最低TPM

import csv
#initiazing
columns = ['start','end','TPM','chr','genes']
keptValues = {}
for c in columns:
    keptValues[c]=[]
################    
def add(k,r):
    for c in columns:
        form = determineFormat(c)
        k[c].append(form(r[c]))
##################
def replace(i,k,r):
    #print('debug: ',i,k,r)
    for c in columns:
        form = determineFormat(c)
        k[c][i] = form(r[c])
#################        
def determineFormat(s):
    if s=='start' or s=='end':
        form = int
    elif s=='TPM':
        form = float
    else:
        form = str
    return form
#################    
with open('bioinfo.csv', 'r') as f:
    reader = csv.DictReader(f)
    for row in reader:
        if int(row['start']) in keptValues['start'] :
            ind = keptValues['start'].index(int(row['start']))
            if keptValues['end'][ind]==int(row['end']):
                if keptValues['TPM'][ind]>float(row['TPM']):
                    replace(ind,keptValues,row)
            else:
                add(keptValues,row)
        else:
            add(keptValues,row)

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python比较CSV-fi的值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >