多处理，缺少1个必需的位置参数：“响应”

import pandas as pd import numpy as np import multiprocessing as mp from multiprocessing.pool import ThreadPool from pytrends.request import TrendReq import requests from bs4 import BeautifulSoup def index(): url = 'https://live.euronext.com/en/pd/data/stocks' params = { "mics": "ALXB,ALXL,ALXP,XPAR,XAMS,XBRU,XLIS,XMLI,MLXB,ENXB,ENXL,TNLA,TNLB,XLDN,XESM,XMSM,XATL,VPXB,XOSL,XOAS,MERK", "display_datapoints": "dp_stocks", "display_filters": "df_stocks" } data = { "draw": "1", "columns[0][data]": "0", "columns[0][name]": "", "columns[0][searchable]": "true", "columns[0][orderable]": "true", "columns[0][search][value]": "", "columns[0][search][regex]": "false", "columns[1][data]": "1", "columns[1][name]": "", "columns[1][searchable]": "true", "columns[1][orderable]": "false", "columns[1][search][value]": "", "columns[1][search][regex]": "false", "columns[2][data]": "2", "columns[2][name]": "", "columns[2][searchable]": "true", "columns[2][orderable]": "false", "columns[2][search][value]": "", "columns[2][search][regex]": "false", "columns[3][data]": "3", "columns[3][name]": "", "columns[3][searchable]": "true", "columns[3][orderable]": "false", "columns[3][search][value]": "", "columns[3][search][regex]": "false", "columns[4][data]": "4", "columns[4][name]": "", "columns[4][searchable]": "true", "columns[4][orderable]": "false", "columns[4][search][value]": "", "columns[4][search][regex]": "false", "columns[5][data]": "5", "columns[5][name]": "", "columns[5][searchable]": "true", "columns[5][orderable]": "false", "columns[5][search][value]": "", "columns[5][search][regex]": "false", "columns[6][data]": "6", "columns[6][name]": "", "columns[6][searchable]": "true", "columns[6][orderable]": "false", "columns[6][search][value]": "", "columns[6][search][regex]": "false", "order[0][column]": "0", "order[0][dir]": "asc", "start": "0", "length": "100", "search[value]": "", "search[regex]": "false", "iDisplayLength": "2000", "iDisplayStart": "0", "sSortDir_0": "asc" } r = requests.post(url, params=params, data=data).json() allin = {'Names': []} for x in r['aaData']: soup = BeautifulSoup(x[0], 'lxml') allin['Names'].append(soup.a.text) df = pd.DataFrame(allin) index_list = df["Names"].tolist() return index_list def collecting_data(index): pytrend = TrendReq() pytrend.build_payload(kw_list=[index]) interest_over_time_df = pytrend.interest_over_time() try: interest_over_time_df.columns = ["Score", "isPartial"] returned_variable = interest_over_time_df.mean(axis = 0)[0] except: returned_variable = np.nan print("[ ]", index, " - processed") return (index, ("Score", returned_variable)) if __name__ == "__main__": index_list = index() col = ["Score"] df = pd.DataFrame(index=index_list, columns=col) pool_size = min(mp.cpu_count(), len(index_list)) pool = mp.Pool(pool_size) for result in pool.imap_unordered(collecting_data, index_list): index, values = result col, value = values df.at[index, col] = value print(df) pool.close()

Exception in thread Thread-3: Traceback (most recent call last): File "C:\Users\MP\AppData\Local\Programs\Python\Python38-32\lib\threading.py", line 932, in _bootstrap_inner self.run() File "C:\Users\MP\AppData\Local\Programs\Python\Python38-32\lib\threading.py", line 870, in run self._target(*self._args, **self._kwargs) File "C:\Users\MP\AppData\Local\Programs\Python\Python38-32\lib\multiprocessing\pool.py", line 576, in _handle_results task = get() File "C:\Users\MP\AppData\Local\Programs\Python\Python38-32\lib\multiprocessing\connection.py", line 251, in recv return _ForkingPickler.loads(buf.getbuffer()) TypeError: __init__() missing 1 required positional argument: 'response'

1条回答

网友

1楼 · 发布于 2024-10-17 00:28:33

我切换到使用线程池进行诊断，并注意到我将看到：

The request failed: Google returned a response with code 429.

我认为，这意味着你发出了太多的请求。对于每单位时间内可以发出多少请求，必须有一些限制。因此，我恢复到像以前一样使用处理池，但修改代码如下，以捕获429异常。正如您所看到的，我现在只收到429个异常，因为我可能在测试中发出了太多的请求。但您需要研究对发出请求的限制（并可能放弃多处理）

from pytrends.exceptions import ResponseError
...

def collecting_data(index):

    try:
        pytrend = TrendReq()
        pytrend.build_payload(kw_list=[index])
        interest_over_time_df = pytrend.interest_over_time()
        interest_over_time_df.columns = ["Score", "isPartial"]
        returned_variable = interest_over_time_df.mean(axis = 0)[0]
    except (Exception, ResponseError) as e:
        print(f'collecting_data got exception for index {index}:', e)
        returned_variable = np.nan

    print("[ ]", index, " - processed")
    return (index, ("Score", returned_variable))

但几乎每个请求都以谷歌429错误结束：

collecting_data got exception for index VRANKEN-POMMERY: The request failed: Google returned a response with code 429.
[ ] VRANKEN-POMMERY  - processed
                   Score
1000MERCIS           NaN
2020 BULKERS         NaN
2CRSI                NaN
2MX ORGANIC          NaN
2MX ORGANIC BS       NaN
...                  ...
ZCI LIMITED          NaN
ZENITH ENERGY        NaN
ZENOBE GRAMME CERT   NaN
ZWIPE                NaN
ØRN SOFTWARE HLD.    NaN

[1748 rows x 1 columns]

相关问题更多 >

编程相关推荐

热门问题

热门文章