考虑到csv_文件['pony_sort']中对应的单元格不是Twilight,我想保存在我的csv_文件['dialog']列中找到Twilight/Sparkle/Twilight Sparkle的次数。我知道这是无效的语法,但是否有可能通过这种方式获得我想要的,如果是,我可以更改什么?谢谢
更新:
example of data:
pony_sort | dialog |
--------------------
twilight | "....twilight"
applejack | "twilight, twilight, twilight!"
在上面的示例中,第一行不计算“twilight”,因为小马排序=twilight。第二行的count=3,因为pony_sort列中没有提到twilight,twilight被提到了三次
twilight_mentions = csv_file[csv_file['dialog'].str.contains("Twilight|Sparkle|Twilight Sparkle").sum() for i in csv_file[pony_sort] != "twilight"]
请记住
series.str.contains
对每一行计数一次,而不管它包含多少搜索词。你要找的是series.str.count
输出
如果不需要
re
标志,可以跳过它请注意可选模式的顺序,如果将示例模式与
'twilight|sparkle|twilight sparkle'
一起使用,则包含'twilight, twilight sparkle'
的行将返回3而不是2。但是,模式'twilight sparkle|twilight|sparkle'
在遇到twil...
时尝试查找第一个选项twilight sparkle
。我不知道确切的正则表达式实现,但是,这是需要注意的相关问题 更多 >
编程相关推荐