如何扫描字符串中的字符以标记匹配是否正确

+-------------+---------+----------+ | Row Index | Col1 | Col2 | +-------------+---------+----------+ | 1 | pasta | pastas | | 2 | sauces | orange | | 3 | kiwi | kiwis | +-------------+---------+----------+

+-------------+---------+----------+---------+ | Row Index | Col1 | Col2 | Col3 | +-------------+---------+----------+---------+ | 1 | pasta | pastas | YES | | 2 | sauces | orange | NO | | 3 | rosin | robert | NO | +-------------+---------+----------+---------+

1条回答

网友

1楼 · 发布于 2024-10-03 13:18:10

这是一条单行线：

df['Col3'] = (df['Col1'].str[:3] == df['Col2'].str[:3]).map(
    {True: 'YES', False: 'NO'})

经验法则：使用pandas/numpy数据所做的几乎所有事情都是矢量格式，即不使用循环

步骤1：从列中的所有字符串中提取前三个字母：您可以通过df['col'].str对象对列执行几乎所有的标准字符串操作。这里：df['Col1'].str[:3]

步骤2：检查3字符前缀是否匹配：同样，您可以直接比较列以获得一列布尔值df['Col1'].str[:3] == df['Col2'].str[:3]

步骤3：将布尔值替换为“是”和“否”。我希望你看到它的发展方向：boolean_data.map({True: 'YES', False: 'NO'})

相关问题更多 >

编程相关推荐

热门问题

热门文章