如何计算另一个列表中列表（作为列）中匹配元素的数量 - 问答 - Python中文网

如何计算另一个列表中列表（作为列）中匹配元素的数量

2024-09-30 05:26:42 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

在多次尝试失败后，我请求帮助解决这个问题。喂，我有一张单子

target = [1990, 1991, 1992, 1993, 1994]

以及数据帧stnYrs作为

STATION        YEARS
A             [1990,1994,1995,1996,1998,2000]
B             [1992,1995,2001]
C             [1988,1989]

我想在stnYrs中创建一个新的NYEAR列，作为target中YEARS列中的匹配年数。Python式的方法是什么？结果应该是这样的

STATION        YEARS                           NYEAR
A             [1990,1994,1995,1996,1998,2000]  2
B             [1992,1995,2001]                 1
C             [1988,1989]                      0

编辑1-

我尝试了Chris和YO建议的方法。如果我使用target和stnYrs的测试示例，这两种方法都可以工作。然而，在我的实际应用中，两人都没有给出正确的答案。我总是为NYEAR得到零。我只是不知道为什么。以下是我的代码中的行：

stnYrs = pd.read_csv('isd_stnNyr_duOnly.txt',dtype={'STATION':'str'})
periods = [(1971,1980),(1981,1990),(1991,2000),(2001,2010)]
for iperd, perd in enumerate(periods):
    ybgn, yend = perd
    target = list(range(ybgn,yend+1))
    stnYrs['NYEAR'] = stnYrs['YEARS'].apply(lambda x: sum(1 for yr in x if yr in target))
    ...

stnYrs[['STATION','YEARS','NYEAR']].head()给出

STATION YEARS NYEAR
0 78982099999 [1959, 1960, 1974, 1975, 1976...] 0
1 69205499999 na 0
2 40941099999 [1976, 1977, 1978] 0
3 40942099999 [1976, 1977, 1978, 1979, 1980...] 0

isd_stnNyr_duOnly.txt文件如下所示

STATION,COUNTRY,GROUP,SOURCE,LAT,LON,ELEVATION,YEARS 78982099999,AA,SAM,4,12.501,-70.015,18.28,"[1959, 1960, 1974, 1975, 1976, 1977, 1978, 1979, 1980, 1981, 1982, 1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990, 1991, 1993, 1997, 1998, 1999, 2000, 2001, 2004, 2008]"
69205499999,AF,SAS,4,32.8,67.633,1989.0,na
40941099999,AF,SAS,4,34.883,65.3,2070.0,"[1976, 1977, 1978]"
40942099999,AF,SAS,4,33.533,65.267,2183.0,"[1976, 1977, 1978, 1979, 1980, 1981, 1983, 1984, 2010, 2019]"

编辑2-

我终于想出了如何将YEARS列转换为列表

def clean(seq_string): return list(map(int, seq_string.strip("[]").split(',')))

stnrec = pd.read_csv('isd_stnNyr_duOnly.txt',dtype={'STATION':'str'},converters={'YEARS': clean})

Tags：方法 in txt 编辑 target pd af station

2条回答

网友

1楼 · 编辑于 2024-09-30 05:26:42

将pandas.DataFrame.apply与内置sum一起使用：

stnYrs['NYEAR'] = stnYrs['YEARS'].apply(lambda x: sum(1 for i in x if i in target))
print(stnYrs)

输出：

  STATION                                 YEARS  NYEAR
0       A  [1990, 1994, 1995, 1996, 1998, 2000]      2
1       B                    [1992, 1995, 2001]      1
2       C                          [1988, 1989]      0

网友

2楼 · 编辑于 2024-09-30 05:26:42

让我们做吧

stnYrs['NYEAR']=pd.DataFrame(stnYrs["YEARS"].tolist()).isin(target).sum(1).values

相关问题更多 >

编程相关推荐

热门问题

热门文章