Pandas结构包含匹配多个字符串并获得匹配值

words = ['dog', 'monkey'] pat = "|".join(map(re.escape, words)) df = pd.DataFrame({'col1':['lion bites dog','dog bites monkey','monkey bites man','man bites apple']}) df.loc[df.col1.str.contains(pat),'col1']

1条回答

网友

1楼 · 发布于 2024-05-20 19:23:32

概念1
使用集合

s = df.col1.str.split().apply(set)

s - (s - set(words))

0            {dog}
1    {monkey, dog}
2         {monkey}
3               {}
Name: col1, dtype: object

概念2
使用str.get_dummies

^{pr2}$

将其拉伸以获得所需的结果

d1 = df.col1.str.get_dummies(sep=' ')
d2 = d1.loc[:, d1.columns.intersection(words)]
d2[d2.any(1)].idxmax(1).reindex(d2.index)

0       dog
1       dog
2    monkey
3       NaN
dtype: object

概念3
使用numpy

s = df.col1.str.split(expand=True).stack()
a = s.values[:, None] == [words]

pd.Series(np.where(a.any(1), a.argmax(1), np.nan), s.index).groupby(level=0).min()

0    0.0
1    0.0
2    1.0
3    NaN
dtype: float64

编程相关推荐

java为引用变量指定默认值
java在2D数组中旋转innersquare
java将hashmap键值与int进行比较
java程序中的并发监视器陷入死锁
安卓 java。lang.NoClassDefFoundError:java。awt。光标
java有没有更好的方法来引用包含对象的对象？
如何在Java编程中循环代码块
java如何在Junit5中使用Serenity？
java使用ANTLR识别JavaScript文件中的全局变量声明
EJB查询对象生成的java视图SQL？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas结构包含匹配多个字符串并获得匹配值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >