如何从文本创建词典?

2024-09-30 03:24:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我是一个python初学者,我有几个长文本格式的列表,我想写一个函数,提取重要的信息,并返回给我一本字典。文本的格式如下:

['text', 'text', 'text', 'text', 'text','text', 'text', 'Country Code', '11111', 'Country Location', 'North', 'Date', '18-03-1878', text','text','text', 'Population': '1289028', 'text', 'text', 'Government', 'Monarchy', 'text', 'text', 'Religion:', 'Catholic']

我需要具体的信息,如国家位置,国家代码和日期。问题是,字符串的位置因文本而异,因此我需要一个函数,首先在文本中查找此信息,将其作为字典的键,并将文本上的下一个元素作为值。我希望得到这样的结果:

{"Country Code": "11111", 
 "Country Location": "North", 
 "Date": "18-03-1878"
 "Population": "1289028"  
 "Religion:" "Catholic"}

我真的很感激你们能提供的任何帮助


Tags: 函数text文本信息date字典codelocation
1条回答
网友
1楼 · 发布于 2024-09-30 03:24:23

如果您不关心效率,并且密钥是一致的,那么您可以编写一个循环

your_list = ['text', 'text', 'text', 'text', 'text','text', 'text', 'Country Code', '11111', 'Country Location', 'North', 'Date', '18-03-1878', 'text','text','text', 'Population', '1289028', 'text', 'text', 'Government', 'Monarchy', 'text', 'text', 'Religion:', 'Catholic']

our_dict = {}

for idx, word in enumerate(your_list):
    if 'Country Code' in word:
        our_dict['Country Code'] = your_list[idx+1]
    if 'Country Location' in word:
        our_dict['Country Location'] = your_list[idx+1]
    if 'Date' in word:
        our_dict['Date'] = your_list[idx+1]
    if 'Population' in word:
        our_dict['Population'] = your_list[idx+1]
    if 'Religion' in word:
        our_dict['Religion'] = your_list[idx+1]

要处理列表中的其他空单元格问题,可以执行以下操作:

for idx, word in enumerate(your_list):
    if len(word.strip(' ')) > 0:
        if 'Country Code' in word:
            our_dict['Country Code'] = your_list[idx+1]
        if 'Country Location' in word:
            our_dict['Country Location'] = your_list[idx+1]
        if 'Date' in word:
            our_dict['Date'] = your_list[idx+1]
        if 'Population' in word:
            our_dict['Population'] = your_list[idx+1]
        if 'Religion' in word:
            our_dict['Religion'] = your_list[idx+1]

较短的解决方案:

#Create a list of items you are interested in (this is a set - only uniques)
itemstofind = {'Country Code', 'Country Location', 'Date', 'Population', 'Religion:'}

# use a dict comprehension to find the items and take next item in the list
# assumes there is no error in the data
d = {item:longlist[ind+1] for ind, item in enumerate(longlist) if item in itemstofind}

相关问题 更多 >

    热门问题