如何将值分配给CSV文件中另一列中的列表列

reader = csv.reader(open('prom_sub.csv', 'r')) writer = csv.writer(open('prom_token.csv', 'w', newline = '')) stop_words = set(stopwords.words('english')) for row in reader: s = row[0] r = row[1] rm_dig = str.maketrans('','', digits) s = s.translate(rm_dig) tr = str.maketrans('','', string.punctuation) tokens = nltk.word_tokenize(s.lower().translate(tr)) filtered_sentence = [w for w in tokens if not w in stop_words] writer.writerow([filtered_sentence, r])

subject rate a 0.11 b 0.11 c 0.11 a 0.3 d 0.3 c 0.3 c 0.07 e 0.07 f 0.18 g 0.18 h 0.18 i 0.18

2条回答

网友

1楼 · 编辑于 2024-09-28 19:11:04

你没有把你的代码放在这里，所以也许collections.defaultdict会帮助你，我不确定我的代码，因为我现在的系统中没有python，我想这样的东西会帮助你：

import csv
import collections as co

dd = co.defaultdict(list)
with open('yourCSV.csv'),'rb') as fin:
    dr = csv.DictReader(fin)
    for line in dr:
        dd[line['subject']].append(line['rate'])

网友

2楼 · 编辑于 2024-09-28 19:11:04

你的中介格式很难处理。第一个字段是字符串列表的Python表示，这不是标准格式。如果可以的话，你应该避免那样做。你知道吗

假设您除了该格式别无选择，唯一可靠的解析方法是literal_eval在ast模块中，它将返回字符串的原始列表，即使是在转角情况下也是如此。所以你的转换脚本可以是：

with open('prom_token.csv') as fdin, open('outfile.csv', 'w', endline='') as fdout:
    reader = csv.reader(fdin)
    writer = csr.writer(fdout)
    for row in reader:
        for elt in ast.literal_eval(row[0]):   # split the Python representation of a list
            writer.writeline(elt, row[1])

相关问题更多 >

编程相关推荐

热门问题

热门文章