转换重复列表元素的类型

from __future__ import absolute_import, division, print_function from itertools import groupby DATA = [["Test", "A", "B01", 828288, 1, 7, 'C', 5], ["Test", "A", "B01", 828288, 1, 7, 'T', 6], ["Test", "A", "B01", 171878, 3, 7, 'C', 5], ["Test", "A", "B01", 171878, 3, 7, 'T', 6], ["Test", "A", "B01", 871963, 3, 9, 'A', 5], ["Test", "A", "B01", 871963, 3, 9, 'G', 6], ["Test", "A", "B01", 1932523, 1, 10, 'T', 4], ["Test", "A", "B01", 1932523, 1, 10, 'A', 5], ["Test", "A", "B01", 1932523, 1, 10, 'X', 6], ["Test", "A", "B01", 667214, 1, 14, 'T', 4], ["Test", "A", "B01", 667214, 1, 14, 'G', 5], ["Test", "A", "B01", 667214, 1, 14, 'G', 6]] def convert(val): constructors = [int, str] for c in constructors: try: return c(val) except ValueError: pass def main(): with open("/home/mic/tmp/test.txt") as f: for line in f: try: data = [convert(part.strip()) for part in line.split(',')] print(data) except IndexError: continue

#!/usr/bin/env python from __future__ import absolute_import, division, print_function from itertools import groupby import csv parts = [["Test", "A", "B01", 828288, 1, 7, 'C', 5], ["Test", "A", "B01", 828288, 1, 7, 'T', 6], ["Test", "A", "B01", 171878, 3, 7, 'C', 5], ["Test", "A", "B01", 171878, 3, 7, 'T', 6], ["Test", "A", "B01", 871963, 3, 9, 'A', 5], ["Test", "A", "B01", 871963, 3, 9, 'G', 6], ["Test", "A", "B01", 1932523, 1, 10, 'T', 4], ["Test", "A", "B01", 1932523, 1, 10, 'A', 5], ["Test", "A", "B01", 1932523, 1, 10, 'X', 6], ["Test", "A", "B01", 667214, 1, 14, 'T', 4], ["Test", "A", "B01", 667214, 1, 14, 'G', 5], ["Test", "A", "B01", 667214, 1, 14, 'G', 6]] def iter_something(rows): key_names = ['type', 'name', 'sub_name', 'pos', 's_type', 'x_type'] chr_key_names = ['letter', 'no'] for keys, group in groupby(rows, lambda row: row[:6]): result = dict(zip(key_names, keys)) result['chr'] = [dict(zip(chr_key_names, row[6:])) for row in group] yield result def main(): #Method 1 converters = [str, str, str, int, int, int, str, int] with open("/home/mic/tmp/test.txt") as f: parts = (line.strip().split(',') for line in f) column = (con(part) for con, part in zip(converters, parts)) for object_ in iter_something(column): print(object_) #Method 2 with open("/home/mic/tmp/test.txt") as f: parts = (line.strip().split(',') for line in f) parts[3], parts[4], parts[5], parts[7] = int(parts[3]),\ int(parts[4]),\ int(parts[5]),\ int(parts[7]) column = (con(part) for con, part in zip(converters, parts)) for object_ in iter_something(column): print(object_) #Method 3 converters = [str, str, str, int, int, int, str, int] with open("/home/mic/tmp/test.txt", 'rb') as f: reader = csv.reader(f, skipinitialspace=True) for object_ in iter_something(reader): print(object_) #Method 4 with open("/home/mic/tmp/test.txt", 'rb') as f: reader = csv.reader(f, skipinitialspace=True) reader[3], reader[4], reader[5], reader[7] = int(reader[3]),\ int(reader[4]),\ int(reader[5]),\ int(reader[7]) for object_ in iter_something(reader): print(object_) if __name__ == '__main__': main()

3条回答

网友
1楼 · 编辑于 2024-09-29 23:33:10

给定一个constructors列表，如您在问题开头所述，您可以这样做：
reader = csv.reader(f) data = [[con(val) for con, val in zip(constructors, line)] for line in reader]
这将为您提供一个二维列表；根据您提供的代码判断，这是您想要的结构。你知道吗
编辑：我修改了解决方案以使用csv模块，您需要在顶部导入该模块。上面的代码当然会包含在with语句中。你知道吗

网友
2楼 · 编辑于 2024-09-29 23:33:10

您可以使用zip()将类型与列配对：
converters = [str, str, str, int, int, int, str, int] for line in f: data = [convert(part.strip()) for convert, part in zip(converters, line.split(','))]
在您的更新中，您再次犯了与您在另一个问题中犯的相同的错误；您在行和列之间产生了混淆，并且正在对行应用该技术：
parts = (line.strip().split(',') for line in f) column = ([con(col) for con, col in zip(converters, row)] for row in parts)
我是否可以再次考虑使用^{} module，就像我对你的previous question所做的那样？您在这里稍微重新发明了CSV解析轮：
with open("/home/mic/tmp/test.txt") as f: reader = csv.reader(f, skipinitialspace=True) converted = ([conv(col) for conv, col in zip(converters, row)] for row in reader)

网友
3楼 · 编辑于 2024-09-29 23:33:10

我会尽力回答你的问题：

由于元素已经是字符串，您只需强制转换int：

data = ["Test", "A", "B01", "667214",  "1",   "14", 'G',"6"]

data[3], data[4], data[5], data[7],= int(data[3]),int(data[4]), int(data[5]), int(data[7])

所以你的主要想法是：

def main():
    with open("/home/mic/tmp/test.txt") as f:
        for line in f:
            try:
                data = [part.strip() for part in line.split(',')]
                data[3], data[4], data[5], data[7],= int(data[3]),int(data[4]), int(data[5]), int(data[7])
            except IndexError:
                continue

但由于您已经在使用try，因此最好为ValueError添加一个异常

except (IndexError,ValueError):

您不需要convert函数，在main中强制转换为int就足够了，没有必要强制转换已经是字符串的字符串

相关问题更多 >

编程相关推荐

热门问题

热门文章