如何使用占位符动态更新defaultdict

2024-09-30 12:28:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我在向键添加值时尝试动态更新字典时遇到问题。在

下面的代码基本上是循环遍历子目录,然后遍历每个子目录中的文件。然后简单地解析每个文件,并将数据添加到defaultdict字典中。“位置”和“编辑比率”字段由两个值组成。我在这里要做的是适应那些最初不是从第一个文件中添加的键。请注意,密钥在每个文件中都是唯一的,但在其他文件中可能存在重复项。同样,也可能有出现在中的键,比如file7,它不在前6个文件中。我想在我的字典中通过在第一个键输入之前有6个占位符(0)来显示这一点。在

dataDict = defaultdict(list)
for root, dirs, filenames in os.walk(rootdir + "/out/"):
    for d in dirs:
        print "Processing: ", d
        colNames.append(d + "_" + sampOriginDict[d])
            for editingFile in os.listdir(rootdir + "/out/" + d):
                eFile = open(rootdir + "/out/" + d + "/" + editingFile, 'r')
                for line in eFile:
                    # only care about 3 fields (chromosome, location and editratio)
                    chromosome, location, x1, x2, x3, x4, editRatio, x5, x6, x7 = line.split("\t")
                    chrLocation = chromosome + "_" + location
                    dataDict[chrLocation].append(editRatio)

下面显示了循环访问2个文件的简要输出:

^{pr2}$

到目前为止,代码还不能容纳占位符。因此,通过查看输出,我不确定“0.15”是来自第一个文件还是第二个文件。在

任何帮助都将不胜感激。谢谢你

编辑:我添加了一个条件来检查键是否已经存在,这是结果输出:

chr17_37916827 ['File2']
chr16_29681751 ['File1']
chr6_150045787 ['File2']
chr10_75538108 ['File1', 'exists']
chr15_64447436 ['File1', 'exists']
chr16_15794023 ['File1', 'exists']

代码:

if chrLocation in dataDict.keys(): 
    dataDict[chrLocation].append("exists")
else:
    dataDict[chrLocation].append(d)

我希望实现输出:

chr17_37916827 ['0', 'File2']
chr16_29681751 ['File1', '0']
chr6_150045787 ['0', 'File2']
chr10_75538108 ['File1', 'exists']
chr15_64447436 ['File1', 'exists']
chr16_15794023 ['File1', 'exists']

Tags: 文件代码infor字典existsoutfile1
1条回答
网友
1楼 · 发布于 2024-09-30 12:28:35

使用当前方法进行此操作的方法

好的,所以您需要知道在开始处有多少个文件,并通过索引或保留计数来更改每个列表中的值,然后迭代您的defaultdict并将占位符值附加到该计数以下的任何一个。。。在

前者的例子:

d = defaultdict(lambda: [0] * 7)

然后对于当前的i

^{pr2}$

但我不建议这样做,因为听起来没有必要保留这些占位符。在


以不同的方式实现同一目标

除非我误解了,否则我们的目标实际上就是能够分辨出哪些文件具有给定的密钥。也许用一种结构

dataDict = defaultdict(dict)

你要做的是dataDict[chrLocation].append(editRatio)而不是做

dataDict[chrLocation][editingFile] = editRatio

然后可以检查是否有位置和文件的值

try:
    print(dataDict['chr10_75538108']['File1'])
except KeyError:
    print('Nope!')

或者,如果不打算使用location和file进行查找,只需将(editingFile, editRatio)的元组追加到列表中。在

相关问题 更多 >

    热门问题