问题描述
以下是我的文本模式:
05.04.0090
1
erhältlichen Tableau Interfaces
lassen sich zusätzliche GLT-Kontakte
aufschalten. Das System kann
die zwei Szenarien-Modi "Urlaub" und
Abwesenheit" verwalten. Für beide
Modi können bestimmte Parameter
programmiert werden.
Das WAREMA climatronic Bediengerät
kann preisgleich auch
in den Farben "schwarz" oder
"schwarz/silber" geliefert werden.
Liefern und montieren. 882,75 882,75
上面的文本块有item_code
,它有这个写05.04.0090
的规范
然后下面是项目的计数1
,然后是description of product
,然后是unit price
,在本例中是EU882,75
最后是sum
,也就是882,74
我想要什么
我想用它制作键值对,就像dict[{'item_code':'5.04.009','quant':'1','description':'TEXT','unit_price':'882,74','Total_sum':'88,75'}]
最后,我将在spacy中使用此模式来识别实体。任何关于spacy的建议都会很好
我试过什么?
pat= re.search(r'\d(.*?)\d',text,re.M)
print(pat.group())
如有帮助或建议,将不胜感激
pprint.pprint函数用于输出。有关所用正则表达式的说明,请转到RegEx101
输出:
相关问题 更多 >
编程相关推荐