如何在DataFram上加速Python apply函数

from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer analyzer = SentimentIntensityAnalyzer() %time full_trans['bsent'] = full_trans['body_text'].apply(lambda row: analyzer.polarity_scores(row))

transtest = full_transx.copy(deep=True) from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer analyzer = SentimentIntensityAnalyzer() %time transtest['bsent'] = [analyzer.polarity_scores(row) for row in transtest['body_text']] %time full_transx['bsent'] = full_transx['body_text'].apply(lambda row: analyzer.polarity_scores(row))

2条回答

网友

1楼 · 编辑于 2024-10-01 09:38:57

循环遍历numpy数组是不高效的。我建议您找到一种将函数应用于数组本身的方法。我不能试试，但也许你可以试试analyzer.polarity_scores(full_trans['body_text'].values)

网友

2楼 · 编辑于 2024-10-01 09:38:57

我假设full_transx['body_text']是一系列字符串。在这种情况下，在底层numpy数组上循环以构建列表通常效率更高：

full_trans['bsent'] = [analyzer.polarity_scores(row) for row in full_trans['body_text'].values]

相关问题更多 >

编程相关推荐

热门问题

热门文章