比较pandas数据帧列中的多个字符串

import numpy as np import pandas as pd dict = {"numericvals": np.repeat(25, 8), "numeric":np.repeat(42, 8), "first":["beneficiary, duke", "compose", "herd primary", "stall", "deep", "regular summary classify", "timber", "property”], "second": ["abcde”, "abcde”, "abcde”, "abcde”, "abcde”, "abcde”, "abcde”, "abcde”]} df = pd.DataFrame(dict1) df = df[['numeric', 'numericvals', 'first', 'second']] print(df) numeric numericvals first second 0 42 25 beneficiary, duke abcde 1 42 25 compose abcde 2 42 25 herd primary abcde 3 42 25 stall abcde 4 42 25 deep abcde 5 42 25 regular summary classify abcde 6 42 25 timber abcde 7 42 25 property abcde

numericvals numeric first second longer shorter 0 25 42 beneficiary, duke abcde 11 4 1 25 42 compose abcde 7 0 2 25 42 herd primary abcde 7 4 3 25 42 stall abcde 0 0 4 25 42 deep abcde 0 4 5 25 42 regular summary classify abcde 7, 7, 8 0 6 25 42 timber abcde 6 0 7 25 42 property abcde 8 0

1条回答

网友

1楼 · 发布于 2024-09-28 01:32:37

您可以使用pandas.DataFrame.apply(source)：

import operator

def transform(df, op):
    lengths = [len(s) for s in df['first'].replace(',', ' ').split()]
    return [f for f in lengths if op(f, len(df.second))] or [0]

df['longer']  = df.apply(transform, axis=1, args=[operator.gt])
df['shorter'] = df.apply(transform, axis=1, args=[operator.lt])

这应该适用于任何数量的字符串，假设任何空格或逗号都表示新字符串。在

输出如下：

^{pr2}$

我尽力了。希望这有帮助！在

相关问题更多 >

编程相关推荐

热门问题

热门文章