擅长:python、mysql、java
<p>如果<code>azdias</code>数据集是从<code>read_csv</code>或类似IO函数获取的,则<code>na_values</code>关键字参数可用于指定特定于列的缺失值表示形式,以确保返回的数据帧从一开始就具有适当的NaN值。示例代码如下所示</p>
<pre><code>from ast import literal_eval
feat_info.set_index("attribute", inplace=True)
# A more concise but less efficient alternative is
# na_dict = feat_info["missing_or_unknown"].apply(literal_eval).to_dict()
na_dict = {attr: literal_eval(val) for attr, val in feat_info["missing_or_unknown"].items()}
df_azdias = pd.read_csv("azidas.csv", na_values=na_dict)
</code></pre>
<p>对于数据类型,整数数据类型没有内置的NaN表示。因此需要浮点数据类型。如果使用<code>fillna</code>填充缺少的值,则可以指定<code>downcast</code>参数以使返回的序列或数据帧具有适当的数据类型</p>