在用Python将URL写入JSON文件时遇到问题

[[ { "company name": "MICROMUSE INC", "cik_number": "1036425", "form_id": "10-Q", "date": "20030213", "file_url": "https://www.sec.gov/Archives/edgar/data/1036425/0001021408-03-002741.txt" }, { "company name": "VENTURE LENDING & LEASING II INC", "cik_number": "1039802", "form_id": "10-Q", "date": "20030213", "file_url": "https://www.sec.gov/Archives/edgar/data/1039802/0001039802-03-000002.txt" }, { "company name": "PHARSIGHT CORP", "cik_number": "1040853", "form_id": "10-Q", "date": "20030213", "file_url": "https://www.sec.gov/Archives/edgar/data/1040853/0001104659-03-002127.txt" } ]]

{ "company name": "PHARSIGHT CORP", "cik_number": "1040853", "form_id": "10-Q", "date": "20030213", "file_url": "https://www.sec.gov/Archives/edgar/data/1040853/0001104659-03-002127.txt" }

{ "url's:[ {"company name":"MICROMUSE INC", "cik_number": "1036425", "form_id": "10-Q", "date": "20030213", "file_url": "https://www.sec.gov/Archives/edgar/data/1036425/0001021408-03-002741.txt" }, { "company name": "VENTURE LENDING & LEASING II INC", "cik_number": "1039802", "form_id": "10-Q", "date": "20030213", "file_url": "https://www.sec.gov/Archives/edgar/data/1039802/0001039802-03-000002.txt" }, { "company name": "PHARSIGHT CORP", "cik_number": "1040853", "form_id": "10-Q", "date": "20030213", "file_url": "https://www.sec.gov/Archives/edgar/data/1040853/0001104659-03-002127.txt"} ] }

def url_ext: #some code to read urls, request those urls and create index . . . #loop through each document in the master list. for index, document in enumerate(master_data): # create a dictionary for each document in the master list document_dict = {} document_dict['cik_number'] = document[0] document_dict['company_name'] = document[1] document_dict['form_id'] = document[2] document_dict['date'] = document[3] document_dict['file_url'] = document[4] master_data[index] = document_dict jsonList = [] for document_dict in master_data: # if it's a 10-K document pull the url and the name. if document_dict['form_id'] == '10-K': # get the components data = {} data['company name'] = document_dict['company_name'] data['cik_number'] = document_dict['cik_number'] data['form_id'] = document_dict['form_id'] data['date'] = document_dict['date'] data['file_url'] = document_dict['file_url'] jsonList.append(data) if document_dict['form_id'] == '10-Q': # get the components data = {} data['company name'] = document_dict['company_name'] data['cik_number'] = document_dict['cik_number'] data['form_id'] = document_dict['form_id'] data['date'] = document_dict['date'] data['file_url'] = document_dict['file_url'] jsonList.append(data) if document_dict['form_id'] == 'NT 10-K': # get the components data = {} data['company name'] = document_dict['company_name'] data['cik_number'] = document_dict['cik_number'] data['form_id'] = document_dict['form_id'] data['date'] = document_dict['date'] data['file_url'] = document_dict['file_url'] jsonList.append(data) if document_dict['form_id'] == 'NT 10-Q': # get the components data = {} data['company name'] = document_dict['company_name'] data['cik_number'] = document_dict['cik_number'] data['form_id'] = document_dict['form_id'] data['date'] = document_dict['date'] data['file_url'] = document_dict['file_url'] jsonList.append(data) return jsonList

with open("SECmasterURLs.txt",'r') as f: byte_data = f.read() master_urls = byte_data.splitlines() JSON_file = open("urls.JSON", 'w') jsonList = [] for line in master_urls: data = url_ext(line) jsonList.append(data) JSON_file.write(json.dumps(jsonList))

1条回答

网友

1楼 · 发布于 2024-05-19 19:18:35

因此json文件内部的结构可能会有所不同。在您的例子中，您会看到列表中有一个列表。因此，当您实际将json文件加载到URL_dict中时，它在两个列表中包含json对象。因此，您可以访问内部列表，然后获得所需的结果

import json
with open('file.json', 'r') as f:
    urls_dict = json.load(f)

urls_dict = urls_dict[0]
itr = iter(urls_dict)

len(list(itr))

因此，当您执行URL_dict[0]时，它会访问内部列表（其索引为0），从而消除嵌套列表

相关问题更多 >

编程相关推荐

热门问题

热门文章