从数据帧中查找字符串中的子字符串索引

import pandas as pd data = {"sequence": ["abcde","fghij","klmno"], "sub_sequence": ["cde", "gh", "no"]} df = pd.DataFrame (data, columns = ['sequence','sub_sequence']) sequence sub_sequence 0 abcde cde 1 fghij gh 2 klmno no

data2 = {"sequence": ["abcde","fghij","klmno"], "sub_sequence": ["cde", "gh", "no"], "start": [2,1,3]} df2 = pd.DataFrame (data2, columns = ['sequence','sub_sequence','start']) sequence sub_sequence start 0 abcde cde 2 1 fghij gh 1 2 klmno no 3

1条回答

网友

1楼 · 发布于 2024-10-04 01:31:19

在列表理解中使用^{}和^{}：

df['start'] = [seq.index(sub) for seq, sub in zip(df['sequence'], df['sub_sequence'])]

或者沿着{}+{a2}使用{a3}：

df['start'] = df[['sequence', 'sub_sequence']].apply(lambda s: str.index(*s), axis=1)

结果:

  sequence sub_sequence  start
0    abcde          cde      2
1    fghij           gh      1
2    klmno           no      3

编程相关推荐

java未能实例化[org.springframework.web.servlet.HandlerMapping]：工厂方法“resourceHandlerMapping”引发异常；没有ServletContext集
date Java 8–使用时区从LocalDateTime创建即时
带有BigInteger的Java hmacSHA256与C不同#
java线在未最大化时绘制在错误的位置
java错误：数据源拒绝建立连接，来自服务器的消息：“连接太多”
java Beanio：如何根据另一个字段值验证字段？
java SonarQube无法连接到>本地主机/0:0:0:0:0:0:0:1:9000
JavaLucene实现对相关性的自定义评分
排序java。lang.IllegalArgumentException：比较方法违反了它的通用合同java。base/java。util。蒂姆索特。合并崩溃
java处理来自另一个类的按钮按下

相关问题更多 >

编程相关推荐

热门问题

热门文章