检查句子是否包含某些子字符串

2024-10-02 04:31:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含特定句子的数据框,例如:

import pandas as pd
df = pd.DataFrame([['how are you', 1], ['this is a random text', 1]], columns=('body', 'ticketID'))
list = df['body'].tolist()

现在我正在寻找最有效的方法来检查字符串是否包含子字符串(列表中的项)。如果我们有这个例子

somestring1 = "this is a random text in a book"
somestring2 = "this text contains an error"

功能应该是

def getRidOfSentencePart():
   #//

getRidOfSentencePart(somestring1)应与“在书中”匹配 和getRidOfSentencePart(somestring1)应计算为“此文本包含错误”

有没有想过我该如何最有效地编程


Tags: 数据字符串textimportpandasdfisas
1条回答
网友
1楼 · 发布于 2024-10-02 04:31:00

如果您想“剪切”从数据帧中从另一个给定字符串中提取的列表中的所有字符串,您只需遍历该列表并用空字符串替换即可

def getRidOfSentencePart(somestring):
    for i in dflist:
        somestring = somestring.replace(i, '')
    return somestring

如果要修剪第一个和最后一个位置的空格,可以改为return somestring.strip()。我不能对这种方法的效率做太多的报道,尽管它看起来很简单

相关问题 更多 >

    热门问题