如何才能最有效地识别和统计单词背后的缩写词,并将其输入新列,但前提是这些缩写词是正确的
期望输出:
|-------Name---------------------------||-Count-|
This is Ante Meridian (AM) not included|| 3 |
This is Ante Meridian (AM) included|| 3 |
This is Ante Meridian (AM) not included|| 3 |
Extra module with Post Meridian (PM) || 1 |
Post Meridian (PO) is not available || 0 | #Mismatch
首先,您需要使用正则表达式来确定()中的字母是否与前面的两个单词匹配
现在您有了一个df,其中acynoym位于它自己的列中,如果它不匹配,则为0。现在我们只需要替换为计数
如果一行中没有(),那么最后也会得到0
如果您只需遵循循环中的模式,则可调节3和更多:
相关问题 更多 >
编程相关推荐