下面是我的txt文件中的一些行(solution、pos和gloss)的副本:
solution: (كَتَبَ kataba) [katab-u_1]
pos: katab/VERB_PERFECT+a/PVSUFF_SUBJ:3MS
gloss: ___ + write + he/it <verb>
我想返回'卡塔布'一词,在第一行方括号内,删除所有工作人员和行和数字每件事。我正在研究python2.7
我试着写这个代码:
pattern = re.compile("'(?P[^']+)':\s*(?P<root>[^,]*)\d+")
当你认为“我需要匹配一个模式”时,你应该认为“正则表达式”是一个很好的起点。见doco。因为输入文件是unicode,所以这有点棘手
输出:
相关问题 更多 >
编程相关推荐