Python线程锁定/类变量初始化混乱

from sklearn.base import BaseEstimator, TransformerMixin import threading class FeatureExtractorBase(BaseEstimator, TransformerMixin): expensive_dependency = {} lock = threading.lock() is_loaded = False @staticmethod def load_dependencies(): FeatureExtractorBase.lock.acquire() if not FeatureExtractorBase.is_loaded: print('first request, start loading..') # load dependencies, takes a while FeatureExtractorBase.is_loaded = True print('done') else: pass FeatureExtractorBase.lock.release() class ActualExtractor(FeatureExtractorBase): def transform(self, data): FeatureExtractorBase.load_dependencies() # generate features from data using dependencies return features

1条回答

网友

1楼 · 发布于 2024-09-28 22:21:21

线程本身并不能加快python进程的速度，其瓶颈是CPU而不是IO（读/写），因为全局解释器锁（GIL）。多任务加速实际上是用来学习并行处理的。这与线程的不同之处在于，对象被复制到一个单独的进程中，因此您的类实际上有多个副本。因此，每次启动新进程时，都会复制原始的、未初始化的类，然后再次进行加载。在

我认为这是sklearn用于网格搜索的主要并行化模块。 https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/externals/joblib/parallel.py

相关问题更多 >

编程相关推荐

热门问题

热门文章