运行高效的pandas列多子集的回归分析

# Imports import pandas as pd import numpy as np import itertools import statsmodels.api as sm # A datafrane with random numbers np.random.seed(123) rows = 12 listVars= ['y','x1', 'x2', 'x3'] rng = pd.date_range('1/1/2017', periods=rows, freq='D') df_1 = pd.DataFrame(np.random.randint(100,150,size=(rows, len(listVars))), columns=listVars) df_1 = df_1.set_index(rng) print(df_1)

1条回答

网友

1楼 · 发布于 2024-09-28 03:14:34

基于我得到的帮助here，我已经能够组合一个函数，该函数接受pandas数据帧中的所有列，定义一个因变量，并返回其余变量的所有唯一组合。结果与上面定义的期望结果有点不同，但我认为对于实际应用来说更有意义。我仍然希望其他人能够发布更好的解决方案。在

这里是：

# Imports
import pandas as pd
import numpy as np
import itertools

# A datafrane with random numbers
np.random.seed(123)
rows = 12
listVars= ['y','x1', 'x2', 'x3']
rng = pd.date_range('1/1/2017', periods=rows, freq='D')
df_1 = pd.DataFrame(np.random.randint(100,150,size=(rows, len(listVars))), columns=listVars) 
df_1 = df_1.set_index(rng)

# The function
def StepWise(columns, dependent):
    """ Takes the columns of a pandas dataframe, defines a dependent variable
        and returns all unique combinations of the remaining (independent) variables.

    """

    independent = columns.copy()
    independent.remove(dependent)

    lst1 = []
    lst2 = []
    for i in np.arange(1, len(independent)+1):
        #print(list(itertools.combinations(independent, i)))
        elem = list(itertools.combinations(independent, i))
        lst1.append(elem)
        lst2.extend(elem)

    combosIndependent = [list(elem) for elem in lst2]
    combosAll =  [[dependent, other] for other in combosIndependent]
    return(combosAll)

lExec = StepWise(columns = list(df_1), dependent = 'y')
print(lExec)

如果您将其与上面的snippet 3结合使用，您可以轻松地将多元回归分析的结果存储在pandas数据框中的指定因变量上。在

相关问题更多 >

编程相关推荐

热门问题

热门文章