擅长:python、mysql、java
<p>不可以。这些变量应被视为分类变量。您可以规范化您的数字变量,然后您需要对分类变量进行分类编码。一种编码方法</p>
<pre><code>pd.get_dummies(df['key'])
#and then delete one of the dummy variables, to avoid the multi-collinearity problem
</code></pre>
<p>使用<code>sklearn</code><a href="https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html" rel="nofollow noreferrer">method</a>的另一种方法</p>
<pre><code>from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder()
data = enc.fit_transform(df['key'])
</code></pre>
<p>只需确保您只适合培训样本上的数据。然后对训练集和测试集进行转换</p>