回答此问题可获得 20 贡献值,回答如果被采纳可获得 50 分。
<p>如何将pandas数据帧转换为sklearn一个热编码(dataframe/numpy数组),其中有些列不需要编码?在</p>
<pre><code>mydf = pd.DataFrame({'Target':[0,1,0,0,1, 1,1],
'GroupFoo':[1,1,2,2,3,1,2],
'GroupBar':[2,1,1,0,3,1,2],
'GroupBar2':[2,1,1,0,3,1,2],
'SomeOtherShouldBeUnaffected':[2,1,1,0,3,1,2]})
columnsToEncode = ['GroupFoo', 'GroupBar']
</code></pre>
<p>是一个已经被标签编码的数据帧,我只想对<code>columnsToEncode</code>标记的列进行编码?在</p>
<p>我的问题是我不确定<code>pd.Dataframe</code>或<code>numpy</code>数组表示是否更好,以及如何将编码部分与另一部分重新合并。在</p>
<p>我目前的尝试:</p>
^{pr2}$
<p>注意:我知道<a href="https://stackoverflow.com/questions/36285155/pandas-get-dummies">Pandas: Get Dummies</a>/<a href="http://pandas.pydata.org/pandas-docs/stable/generated/pandas.get_dummies.html" rel="nofollow noreferrer">http://pandas.pydata.org/pandas-docs/stable/generated/pandas.get_dummies.html</a>,但这在我要求每次进行这样的编码的训练/测试分割中不起作用。在</p>