我有一个包含特定句子的数据框,例如:
import pandas as pd
df = pd.DataFrame([['how are you', 1], ['this is a random text', 1]], columns=('body', 'ticketID'))
list = df['body'].tolist()
现在我正在寻找最有效的方法来检查字符串是否包含子字符串(列表中的项)。如果我们有这个例子
somestring1 = "this is a random text in a book"
somestring2 = "this text contains an error"
功能应该是
def getRidOfSentencePart():
#//
getRidOfSentencePart(somestring1)应与“在书中”匹配 和getRidOfSentencePart(somestring1)应计算为“此文本包含错误”
有没有想过我该如何最有效地编程
如果您想“剪切”从数据帧中从另一个给定字符串中提取的列表中的所有字符串,您只需遍历该列表并用空字符串替换即可
如果要修剪第一个和最后一个位置的空格,可以改为
return somestring.strip()
。我不能对这种方法的效率做太多的报道,尽管它看起来很简单相关问题 更多 >
编程相关推荐