Python分割字符串,尊重并保留引号

2024-09-28 03:25:11 发布

您现在位置:Python中文网/ 问答频道 /正文

使用python,我想分割以下字符串:

a=foo, b=bar, c="foo, bar", d=false, e="false"

这将导致以下列表:

['a=foo', 'b=bar', 'c="foo, bar"', 'd=false', 'e="false'"']

在posix模式下使用shlex并用“,”分隔时,c的参数得到正确处理。但是,它删除了引号。我需要它们,因为false"false"不同。

我的代码:

import shlex

mystring = 'a=foo, b=bar, c="foo, bar", d=false, e="false"'

splitter = shlex.shlex(mystring, posix=True)
splitter.whitespace += ','
splitter.whitespace_split = True
print list(splitter) # ['a=foo', 'b=bar', 'c=foo, bar', 'd=false', 'e=false']

Tags: 字符串falsetrue列表参数foo模式bar
2条回答
>>> s = r'a=foo, b=bar, c="foo, bar", d=false, e="false", f="foo\", bar"'
>>> re.findall(r'(?:[^\s,"]|"(?:\\.|[^"])*")+', s)
['a=foo', 'b=bar', 'c="foo, bar"', 'd=false', 'e="false"', 'f="foo\\", bar"']
  1. regex模式"[^"]*"匹配一个简单的带引号的字符串。
  2. "(?:\\.|[^"])*"匹配带引号的字符串并跳过转义引号,因为\\.使用两个字符:反斜杠和任何字符。
  3. [^\s,"]匹配非分隔符。
  4. 组合模式2和模式3在(?: | )+中匹配一系列非分隔符和带引号的字符串,这是所需的结果。

Regex可以很容易地解决这个问题:

import re

mystring = 'a=foo, b=bar, c="foo, bar", d=false, e="false"'

splitString = re.split(',?\s(?=\w+=)',mystring)

这里的regex模式查找一个空白,后跟一个单词字符,然后是一个等号,它可以根据需要拆分字符串并维护任何引号。

相关问题 更多 >

    热门问题