有没有办法在数据帧的列中查找模式

2024-09-27 19:32:04 发布

您现在位置:Python中文网/ 问答频道 /正文

我从一个更大的{}中得到了{}{}。列web_id包含larger dataframe中缺少的ids

我正在试图找到一种模式,它们是从更大的dataset中丢失的

例如,以下代码可在本地计算机上复制。以下是我目前的数据集示例:

pd.DataFrame({
"web_id": [43291, 43300, 43313, 43316, 43335, 43345, 43346, 43353, 43361, 43373, 43383, 43387, 43416],
"date": "12/17/2019"
})

我相信这种缺失是有规律的。我怎样才能找到web_id的序列来进一步了解数据是如何从较大的dataset中丢失的

非常感谢


Tags: 数据代码webidids示例dataframedate
1条回答
网友
1楼 · 发布于 2024-09-27 19:32:04
x = pd.DataFrame({ "web_id": [43291, 43300, 43313, 43316, 43335,
43345, 43346, 43353, 43361, 43373, 43383, 43387, 43416], })

ls = [] 
for i in x.values:  
   for j in i:        
       ls.append(j)

for i in range(len(ls)-1):    
    print(ls[i+1] - ls[i])

这将打印出列中每个值之间的差值。我没有注意到任何数学序列,至少使用这种差分方法

产出:9, 13, 3. 19, 10, 1. 7. 8. 12, 10, 4. 二十九

实际上,您可以在这里https://oeis.org/验证之前是否找到了该序列。似乎不是这样。祝你好运

相关问题 更多 >

    热门问题