Python会将id相同但值不同的术语附加到列表中吗？

id concept phrase -------------------------------- 1 general_history H&P 1 general_history history and physical 1 general_history history physical 2 clinic_history clinic history physical 2 clinic_history outpatient h p 3 discharge discharge summary 3 discharge DCS

3条回答

网友

1楼 · 编辑于 2024-06-28 20:47:49

使用for循环to和defaultdict累积术语

import csv
from collections import defaultdict
var = defaultdict(list)
records = ...  # read csv with csv.DictReader
for row in records:
    concept = row.get('concept', None)
    if concept is None: continue
    phrase = row.get('phrase', None)
    if phrase is None: continue
    var[concept].append(phrase)
print(var)

网友

2楼 · 编辑于 2024-06-28 20:47:49

假设您已经可以解析csv，下面是如何按照概念进行排序

from collections import defaultdict

concepts = defaultdict(list)

""" parse csv """

for row in csv:
    id, concept, phrase = row
    concepts[concept].append(phrase)

var = [[k, concepts[k]] for k in concepts.keys()]

var将包含以下内容：

[['general_history', ['history and physical', 'history physical']...]

甚至可能有用的是，如果您维护该字典的键，因为var看起来像这样：

{
  "general_history": [
    "history and physical",
    "history physical",
  ],
 ...
}

网友

3楼 · 编辑于 2024-06-28 20:47:49

如果您使用的是熊猫，请尝试过滤。它应该是这样的：

new_dataframe = dataframe[dataframe['id'] == id]

然后，连接数据帧

final_df = pd.concat([new_dataframe1, new_dataframe2], axis = 0)

你也可以尝试在概念上做同样的事情

相关问题更多 >

编程相关推荐

热门问题

热门文章