所以!在
下面是一个使用itertoos.groupby
的函数:
from string import whitespace, punctuation
from itertools import groupby
def tokenize(phrase, sepcat=True):
separators = dict.fromkeys(whitespace + punctuation, True)
return [''.join(g) for k, g in groupby(phrase, separators.get)]
现在,输出如下:
如您所见,连续的分隔符被连接成一个字符串。我希望这个行为是可选的(正如我的函数中的sepcat
参数所表示的),但是这是我遇到的一个障碍。。。如何将参数传递给separators.get
?在
像functools
这样的东西能帮我吗?在
使用lambda:
相关问题 更多 >
编程相关推荐