!!目的是将工作方法应用于数据帧中的文本!!你知道吗
鉴于我有如下句子:
“他邀请了两个人和三只宠物狗。”
“她邀请了三个朋友和一只宠物猫。”
对于每一句话,我想在一个变量中计算有多少人被邀请,有多少宠物是宠物。这通过regex很容易实现:
sentence = 'He invited 2 people and pet 3 dogs.'
human = [r'(\d+) people', r'(\d+) friend']
for h in human:
number = re.search(h, sentence, re.IGNORECASE)
if number is not None:
number = number.group(1)
print('humans invited: ',number)
现在句子在“句子”列的数据框中。Dataframe还有一个名为“humans”的列和一个名为“pets”的列。我现在想用第一句话,像上面那样处理,把结果写进“人类”栏,对宠物做同样的处理,然后写进“宠物”栏。但是,我不知道如何将它逐行应用于数据帧。你知道吗
如果句子中只有2个数字,而你总是期望
humans
在pets
之前出现,你可以一次得到所有的数字:df
现在是:对于熊猫,您可以使用
str.extract
,例如:宠物也一样
相关问题 更多 >
编程相关推荐