擅长:python、mysql、java
<p>如果<code>azdias</code>数据集是从<code>read_csv</code>或类似的IO函数获得的,则可以使用<code>na_values</code>关键字参数指定特定于列的缺失值表示形式,以确保返回的数据帧从一开始就具有适当的NaN值。示例代码如下所示。你知道吗</p>
<pre><code>from ast import literal_eval
feat_info.set_index("attribute", inplace=True)
# A more concise but less efficient alternative is
# na_dict = feat_info["missing_or_unknown"].apply(literal_eval).to_dict()
na_dict = {attr: literal_eval(val) for attr, val in feat_info["missing_or_unknown"].items()}
df_azdias = pd.read_csv("azidas.csv", na_values=na_dict)
</code></pre>
<p>至于数据类型,整数数据类型没有内置的NaN表示。因此需要浮点数据类型。如果使用<code>fillna</code>来填充缺少的值,则可以指定<code>downcast</code>参数,以使返回的序列或数据帧具有适当的数据类型。你知道吗</p>