Python2re.sub公司发行

def highlight_text(st, kwlist, start_tag=None, end_tag=None): if start_tag is None: start_tag = '<span class="nom">' if end_tag is None: end_tag = '</span>' for kw in kwlist: st = re.sub(r'\b' + kw + r'\b', '{}{}{}'.format(start_tag, kw, end_tag), st) return st

2条回答

网友
1楼 · 编辑于 2024-10-06 10:34:23

在python2.7中，需要显式地将文本转换为Unicode。请参见下面的固定片段：
# -*- coding: utf-8 -*- import re def highlight_text(st, kwlist, start_tag=None, end_tag=None): if start_tag is None: start_tag = '<span class="nom">' if end_tag is None: end_tag = '</span>' for kw in kwlist: st = re.sub(ur'\b' + kw.decode('utf8') + ur'\b', u'{}{}{}'.format(start_tag.decode('utf8'), kw.decode('utf8'), end_tag.decode('utf8')), st.decode('utf8'), 0, re.U).encode("utf8") return st st="Korais Ο Αδαμάντιος Κοραής (Σμύρνη, 27 Απριλίου 1748 – Παρίσι, 6 Απριλίου 1833), ήταν Έλληνας φιλόλογος με βαθιά γνώση του ελληνικού πολιτισμού. Ο Κοραής είναι ένας από τους σημαντικότερους εκπροσώπους του νεοελληνικού διαφωτισμού και μνημονεύεται, ανάμεσα σε άλλα, ως πρωτοπόρος στην έκδοση έργων αρχαίας ελληνικής γραμματείας, αλλά και για τις γλωσσικές του απόψεις στην υποστήριξη της καθαρεύουσας, σε μια μετριοπαθή όμως μορφή της με σκοπό την εκκαθάριση των πλείστων ξένων λέξεων που υπήρχαν στη γλώσσα του λαού." kwlist = ['ελληνικού', 'Σμύρνη', 'Αδαμάντιος', 'Korais'] d = highlight_text(st, kwlist, start_tag=None, end_tag=None) print(d)
见demo
注意，所有的文字都用u前缀声明，所有变量都是decodeed，re.sub结果是encoded返回UTF8。在

网友
2楼 · 编辑于 2024-10-06 10:34:23

English get tagged. Greek substr are ignored.
你的st来自哪里？请注意，在python2.x中'μορφή' != u'μορφή'中，您可能正在比较str和{}。在
建议：尽可能在任何地方使用unicode，例如：
kwlist = [u'ελληνικού', u'Σμύρνη', u'Αδαμάντιος', u'Korais']

相关问题更多 >

编程相关推荐

热门问题

热门文章