擅长:python、mysql、java
<p>你所说的数据是绝对的。
基本上,数据集中的数据主要是顺序(数字)或分类的。你知道吗</p>
<p>我建议您通过将分类变量转换为伪代码来处理这个问题。
例如,假设您有一个如下所示的数据帧</p>
<pre><code>Id, Country
1, US
2, UK
3, Germany
</code></pre>
<p>将此代码转换为伪代码</p>
<pre><code>Id, US, UK, Germany
1, 1,0,0
2, 0,1,0
3, 0,0,1
</code></pre>
<p>有多个包将分类数据转换为伪代码。我认为熊猫也有功能。你知道吗</p>
<p>然后可以使用上面的数据帧来训练您的模型</p>