web刮取时间过长，python中没有输出问题的回答

web刮取时间过长，python中没有输出

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

<p>我目前正试图收集发电厂的数据。附件是我的代码如下所示：</p> <pre><code>#Import packages import urllib.request from bs4 import BeautifulSoup import pandas as pd import csv #For loop to scrap details of power plants gas_lst=[] for i in range(1,46624): pid=str(i) url="http://www.globalenergyobservatory.com/form.php?pid=" + pid page=urllib.request.urlopen(url) soup=BeautifulSoup(page,'html.parser') #Distinguish power plants to different types of primary fuel types=soup.find(id="Type") power_types=types["value"] ###Breakdown of different units if power_types=="Gas": i = 1 while True: if soup.find(id="unitcheck" + str(i)) == None: break else: gas_unit=soup.find(id="unitcheck" + str(i)) gas_unit_values=gas_unit["value"] gas_capacity=soup.find(id="Capacity_(MWe)_nbr_" + str(i)) gas_capacity_values=gas_capacity["value"] gas_commissioned=soup.find(id="Date_Commissioned_dt_" + str(i)) gas_commissioned_date=gas_commissioned["value"] gas_decommissioned=soup.find(id="Decommission_Date_dt_" + str(i)) gas_decommissioned_date=gas_decommissioned["value"] gas_HRSG=soup.find(id="Boiler/HRSG_Manufacturer_" + str(i)) gas_HRSG_OEM=gas_HRSG["value"] gas_turbine=soup.find(id="Turbine_Manufacturer_" + str(i)) gas_turbine_OEM=gas_turbine["value"] gas_generator=soup.find(id="Generator_Manufacturer_" + str(i)) gas_generator_OEM=gas_generator["value"] i = i+1 else: continue #Gas units breakdowns gas_lst.append([gas_unit_values,gas_capacity_values,gas_commissioned_date,gas_decommissioned_date,gas_HRSG_OEM,gas_turbine_OEM,gas_generator_OEM]) gas_df=pd.DataFrame(gas_lst) gas_df.columns=['Unit','Capacity','Date_commissioned','Date_decommissioned','HRSG_manufacturer','Turbine_manufacturer','Generator_manufacturer'] print(pid) #Convert to csv file gas_df.to_csv('gas_units_breakdowns.csv',index=False) </code></pre> <p>然而，这个过程耗时太长，而且似乎根本没有任何输出。我想知道是不是因为我的代码错了？任何帮助都是非常感谢的。在</p>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

web刮取时间过长，python中没有输出

1 个回答

相关Python问题