如何在python中进行CamelCase拆分

string: '' AplusKminus: [''] casimir_et_hippolyte: [] two_hundred_success: [] kalefranz: string index out of range # with modification: either [] or [''] string: ' ' AplusKminus: [' '] casimir_et_hippolyte: [] two_hundred_success: [' '] kalefranz: [' '] string: 'lower' all algorithms: ['lower'] string: 'UPPER' all algorithms: ['UPPER'] string: 'Initial' all algorithms: ['Initial'] string: 'dromedaryCase' AplusKminus: ['dromedary', 'Case'] casimir_et_hippolyte: ['dromedary', 'Case'] two_hundred_success: ['dromedary', 'Case'] kalefranz: ['Dromedary', 'Case'] # with modification: ['dromedary', 'Case'] string: 'CamelCase' all algorithms: ['Camel', 'Case'] string: 'ABCWordDEF' AplusKminus: ['ABC', 'Word', 'DEF'] casimir_et_hippolyte: ['ABC', 'Word', 'DEF'] two_hundred_success: ['ABC', 'Word', 'DEF'] kalefranz: ['ABCWord', 'DEF']

3条回答

网友

1楼 · 编辑于 2024-05-19 01:05:33

正如@AplusKminus所解释的，re.split()从不在空模式匹配上拆分。因此，与其拆分，不如尝试查找感兴趣的组件。

下面是一个使用re.finditer()模拟拆分的解决方案：

def camel_case_split(identifier):
    matches = finditer('.+?(?:(?<=[a-z])(?=[A-Z])|(?<=[A-Z])(?=[A-Z][a-z])|$)', identifier)
    return [m.group(0) for m in matches]

网友

2楼 · 编辑于 2024-05-19 01:05:33

使用re.sub()和split()

import re

name = 'CamelCaseTest123'
splitted = re.sub('([A-Z][a-z]+)', r' \1', re.sub('([A-Z]+)', r' \1', name)).split()

结果

'CamelCaseTest123' -> ['Camel', 'Case', 'Test123']
'CamelCaseXYZ' -> ['Camel', 'Case', 'XYZ']
'XYZCamelCase' -> ['XYZ', 'Camel', 'Case']
'XYZ' -> ['XYZ']
'IPAddress' -> ['IP', 'Address']

网友

3楼 · 编辑于 2024-05-19 01:05:33

大多数情况下，当您不需要检查字符串的格式时，全局搜索比拆分更简单（对于相同的结果）：

re.findall(r'[A-Z](?:[a-z]+|[A-Z]*(?=[A-Z]|$))', 'CamelCaseXYZ')

回报

['Camel', 'Case', 'XYZ']

要处理dromedary，也可以使用：

re.findall(r'[A-Z]?[a-z]+|[A-Z]+(?=[A-Z]|$)', 'camelCaseXYZ')

注意：(?=[A-Z]|$)可以使用双反（带反字符类的负展望）来缩短：(?![^A-Z])

相关问题更多 >

编程相关推荐

热门问题

热门文章