如何将特定长度的字符串与正则表达式匹配

3条回答

网友

1楼 · 编辑于 2024-07-07 08:27:41

你需要分两步来完成。对于这样简单的解析问题，正则表达式实际上有点过头了。我是这样做的：

def read_string(stream):
    pos = stream.index(':')
    length = int(stream[0:pos])
    string = stream[pos+1:pos+1+length]
    return string, stream[pos+1+length:]

这是一种函数式的解析方法，它返回解析的值和流的其余部分。在

对于列表，可能是：

^{pr2}$

然后定义一个read_对象来检查流的第一个字符并进行适当的分派。在

网友

2楼 · 编辑于 2024-07-07 08:27:41

如果对字符串进行两次解析，就可以这样做。应用第一个正则表达式来获取长度。连接第二个正则表达式中的长度以形成有效表达式。在

不知道如何在python中实现，但C中的一个示例是：

string regex = "^[A-Za-z0-9_]{1," + length + "}$"

如果要将1与length匹配，则字符数可以是alphanumeric或u，其中length是根据只检索长度的前一个正则表达式确定的。在

希望这有帮助：）

网友

3楼 · 编辑于 2024-07-07 08:27:41

为此使用的任何解析器都需要是有状态的（即记住东西），而regex基本上不是有状态的。他们不适合做这项工作。在

如果这些是您唯一需要担心的数据类型，我想我应该为每个数据类型编写自定义解析器，在读取第一个字符之后将控制权传递给相应的解析器。在

~~我现在真的要实施一个了，但是已经晚了。~~

好吧，我决定写一个实现：

from StringIO import StringIO
import string

inputs = ["10:a stringly",
         "i1234e" ,
         "l1:a1:be",
         "d1:a1:b3:one3:twoe"]

# Constants
DICT_TYPE = 'd'
LIST_TYPE = 'l'
INT_TYPE  = 'i'
TOKEN_EOF = ''
TOKEN_END = 'e'
COLON     = ':'


class BadTypeIndicatorException(Exception):pass


def read_int(stream):

   s = ""

   while True:
      ch = stream.read(1)
      if ch not in [TOKEN_EOF, TOKEN_END, COLON]:
         s += ch
      else:
         break

   return s


def tokenize(stream):

   s = ""

   while True:

      ch = stream.read(1)

      if ch == TOKEN_END or ch == TOKEN_EOF:
         return 

      if ch == COLON:
         length = int(s)
         yield stream.read(length)
         s = ""

      else:
         s += ch


def parse(stream):

   TYPE = stream.read(1)

   if TYPE in string.digits:
      length = int( TYPE + read_int(stream) )
      return stream.read(length)

   elif TYPE is INT_TYPE: 
      return int( read_int(stream) )

   elif TYPE is LIST_TYPE: 
      return list(tokenize(stream))

   elif TYPE is DICT_TYPE:
      tokens = list(tokenize(stream))
      return dict(zip(tokens[0::2], tokens[1::2]))

   else: 
      raise BadTypeIndicatorException



for input in inputs:
   stream = StringIO(input)
   print parse(stream)

相关问题更多 >

编程相关推荐

热门问题

热门文章