python标记化中的Bug？

2024-09-30 05:26:10 发布

男 | 程序猿一只，喜欢编程写python代码。

为什么会这样

if 1 \
and 0:
    pass

最简单的代码阻塞在标记化/非标记化循环上

^{pr2}$

它抛出：

AssertionError:
File "/mnt/home/anushri/untitled-1.py", line 13, in <module>
  print tok_untok(src)
File "/mnt/home/anushri/untitled-1.py", line 6, in tok_untok
  tokenize.untokenize(tokenize.generate_tokens(f.readline))
File "/usr/lib/python2.6/tokenize.py", line 262, in untokenize
  return ut.untokenize(iterable)
File "/usr/lib/python2.6/tokenize.py", line 198, in untokenize
  self.add_whitespace(start)
File "/usr/lib/python2.6/tokenize.py", line 187, in add_whitespace
  assert row <= self.prev_row

是否有一个不修改src以标记化的解决方法（似乎\是罪魁祸首）

另一个失败的例子是如果结尾没有换行，例如src='if 1:pass'失败，并出现相同的错误

解决方法：但它似乎使用了不同的方法

def tok_untok(src):
    f = cStringIO.StringIO(src)
    tokens = [ t[:2] for t in tokenize.generate_tokens(f.readline)]
    return tokenize.untokenize(tokens)

即不传回整个令牌元组，而只传回t[：2]

尽管python doc表示跳过了额外的参数

Converts tokens back into Python source code. The iterable must return sequences with at least two elements, the token type and the token string. Any additional sequence elements are ignored.

Tags：方法 in py 标记 src return lib usr

1条回答

网友

1楼 · 发布于 2024-09-30 05:26:10

是的，这是一个known bug，人们对一个比这个问题所附的补丁更干净的补丁感兴趣。为更好的Python做贡献的最佳时机；）

python标记化中的Bug？

相关问题更多 >

编程相关推荐

热门问题

热门文章

python标记化中的Bug？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >