Python中文
首页
教程
问答
标签
搜索
登录
注册
Pandas:列中每个值的nan百分比
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>目标:获取df每列和每个客户机的缺失值百分比</p> <p>我的df是关于创建票据的:</p> <pre><code> id type ... priority Client 0 56 113 Incident ... Low client1 1 56 267 Demande ... High client1 2 56 294 Incident ... Nan NaN 3 56 197 Demande ... Low client3 4 56 143 Demande ... Nan client4 </code></pre> <p>第一次尝试:</p> <pre><code>df.notna().sum()/len(agg_global)*100 Out[29]: id 97.053453 type 76.415869 priority 82.626625 client 84.596443 </code></pre> <p>这非常有用,但我想在我的输出中添加更多详细信息,列中的“客户端”维度如下:</p> <p>我要创建的输出:</p> <pre><code> Client1 Client2 Client3 NaN id 100.000000 100.000000 100.000000 66.990424 type 76.415869 66.990424 76.415869 43.761970 status 100.000000 100.000000 66.990424 76.415869 category 66.990424 43.761970 76.415869 43.761970 entity 43.761970 100.000000 76.415869 76.415869 source_demande 84.596443 100.000000 76.415869 43.761970 </code></pre> <p>我尝试使用“groupby”,但无法获得欲望输出…:</p> <pre><code> id type ... priority Client client ... True 97.053453 76.415869 ... 29.98632 29.98632 </code></pre> <p>如有任何建议,将不胜感激。谢谢你的关注</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>在我看来,使用暴力是可能的。我会尝试使用<a href="https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.isna.html" rel="nofollow noreferrer">isna</a>函数和求和来估计每行或每列中的NaN数,然后我会尝试估计百分比</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
区分轴上的像素大小
1 回答
区分过度拟合与良好预测
9 回答
区分通过POST接收的数据并在Cherrypy中获取
2 回答
区分重写和重载
4 回答
区分金贾二号的类型
6 回答
区别:IF IN和IF==python
4 回答
区别:list.append()与incrementequal?
3 回答
区别:创建在启动wx应用程序时不“阻止”控制台的脚本
7 回答
区别于python中的命令行和CGI
4 回答
区别关系
9 回答
区别是什么APIClient.enforce\ csrf\检查以及APIClient.handler.enforce\ csrf\ u检查
4 回答
区块.draw()未在python空闲模式下工作
7 回答
区块链API调用输出对象名称而不是内容
5 回答
区块链nonce值随负载变化
1 回答
区块链Python语法错误(Snakecoin)
5 回答
区块链不连接到服务器和矿工
2 回答
区块链信息钱包支票支付员
8 回答
区块链和区块链密码错误
6 回答
区块链尝试向Transaction字典添加键/值以创建区块链
7 回答
区域:IOError:[Errno 22]无效模式('w')或filenam
3 回答