Python中文
首页
教程
问答
标签
搜索
登录
注册
Python:pivot\u table和groupby得到完全相反的resu
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我正在处理来自[<em>seaborn</em>]的数据集<strong>titanic</strong>。你知道吗</p> <pre><code>titanic = seaborn.load_dataset('titanic') </code></pre> <p>我把“年龄”一栏分成了分类栏。你知道吗</p> <pre><code>age = pd.cut(titanic['age'], [0, 18, 80]) </code></pre> <p>然后问题来了,groupby和pivot表给出了完全不同的结果:</p> <pre><code>titanic.groupby(['sex', age, 'class'])['survived'].mean().unstack(-1) titanic.pivot_table('survived', ['sex', age], 'class') </code></pre> <p><a href="https://i.stack.imgur.com/1Ecd9.png" rel="nofollow noreferrer">groupby and pivot_table results</a></p> <p>一开始,我猜是因为nan在<strong>年龄<strong>,然后我用dropna处理的数据集来重做它。你知道吗</p> <pre><code>titanic = titanic.dropna() age = pd.cut(titanic['age'], [0, 18, 80], right = True) titanic.groupby(['sex', age, 'class'])['survived'].mean().unstack(-1) titanic.pivot_table('survived', ['sex', age], 'class') </code></pre> <p>这次我甚至得到了完全不同的结果。你知道吗</p> <p><a href="https://i.stack.imgur.com/6757L.png" rel="nofollow noreferrer">groupby and pivot_table results after dropna</a></p> <p>我的python版本是:python3.6.5::Anaconda,Inc。 熊猫:0.23.0</p> <p>我的操作系统是MaxOS High Sierra 10.13.6</p> <p>我再次尝试使用python3.7.0和pandas0.23.4,没有出现错误。你知道吗</p> <p><a href="https://i.stack.imgur.com/maLu2.png" rel="nofollow noreferrer">result under python 3..7.0</a></p> <p>所以我想知道是不是水蟒的虫子?你知道吗</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我试过你的陈述,得到了匹配的结果: <a href="https://i.stack.imgur.com/r6vo1.png" rel="nofollow noreferrer">enter image description here</a></p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
10 回答
为什么在使用strptim时会出现这个datetime日期错误
6 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
3 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
6 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
9 回答
为什么在使用tabla时会得到一个空的数据帧?
7 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
9 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
8 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
6 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
1 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
10 回答
为什么在使用TextBlob时会出现HTTP错误?
3 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
2 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
6 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
1 回答
为什么在使用tkinter时不能使用复选框?
5 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
9 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
6 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
2 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
8 回答