如何在python中从列表创建多个子类？

2WQZ_chain_A Score = 338.0 53-164 208-317 327-595 611-654 2WQZ_chain_B Score = 344.0 53-164 205-317 327-595 611-655 2XB6_chain_A Score = 319.0 64-163 211-317 327-596 613-654 2XB6_chain_B Score = 329.0 53-163 212-317 327-596 613-654

class PDB(object): def __init__(self, pdbname): self.pdbid = pdbname class Chain(PDB): def __init__(self, chainame, score, pdbname): self.chainid = chainame self.score = score super().__init__(pdbname) making_class = open("covered_intervals.txt", "r").readlines() pdblist = [] for i in making_class: if "chain" in i: pdblist.append(i[:4]) pdblist = list(dict.fromkeys(pdblist)) pdblist2 = dict.fromkeys(pdblist) for i in pdblist: pdblist2[i] = PDB(i) for j in making_class: if i in j: chainame = j[5:12] pdblist2[i] = Chain(chainame, 4, i)

2条回答

网友

1楼 · 编辑于 2024-10-02 22:34:03

首先，我建议创建一些东西，可以将文件中的一个textblock解析为可用变量，例如：

def parse_block(lines):
    pdb_name = lines[0][:4]
    chain = lines[0][5:]
    score = lines[1].split("=")[1].strip()
    intervals = lines[2:]
    return (pdb_name, chain, score, intervals)

使用它，您可以构建类，或者使用嵌套字典，这样也可以很好地适应数据结构

from collections import defaultdict

with open("pdbdata", "r") as f:
    content = f.read()

pdb_dict = defaultdict(dict)

for block in content.split("\n\n"):
    pdb_name, chain, score, intervals = parse_block(block.splitlines())
    pdb_dict[pdb_name][chain] = {"score": score, "intervals": intervals}

生成的嵌套dict如下所示：

{'2WQZ': {'chain_A': {'intervals': ['53-164', '208-317', '327-595', '611-654'],
                      'score': '338.0'},
          'chain_B': {'intervals': ['53-164', '205-317', '327-595', '611-655'],
                      'score': '344.0'}},
 '2XB6': {'chain_A': {'intervals': ['64-163', '211-317', '327-596', '613-654'],
                      'score': '319.0'},
          'chain_B': {'intervals': ['53-163', '212-317', '327-596', '613-654'],
                      'score': '329.0'}}}

网友

2楼 · 编辑于 2024-10-02 22:34:03

在这种情况下，可以为顶部节点创建一个字典，因为它是一个固定深度的树，所以不需要类嵌套。链类将有三个组件

链名
得分
范围列表-我为范围实现了一个类

class Chain():
    def __init__(self, chainame,  score=None):
        self.chainid = chainame
        self.score = score
        self.ranges=[]

    def add_range(self, range):
        self.ranges.append(range)

    def add_score(self, score):
        self.score = score


class range1():
    def __init__(self, str):
        x = str.split("-")
        self.start = int(x[0])
        self.end = int(x[1])

counter = 0
pdb = ""
ch = None
data = {}

with open("covered_intervals.txt", "r") as f:
    line = f.readline()
    while line:
        line = line.strip()
        if line.strip()=="":
            counter=0
            x = data.get(pdb, [])
            x.append(ch)
            data[pdb] = x
        elif counter==0:
            x = line.split("_", 1)
            pdb = x[0]
            chainname = x[1]
            ch = Chain(chainname)
            counter  = counter +1
        elif counter==1:
            ch.add_score(float(line.split("=")[1]))
            counter = counter +1
        else:
            ch.add_range(range1(line))
        line = f.readline()

if counter != 0:
    x = data.get(pdb, [])
    x.append(ch)
    data[pdb] = x

相关问题更多 >

编程相关推荐

热门问题

热门文章