擅长:python、mysql、java
<p>唯一可靠的方法是枚举可能出现的所有上标和下标符号,并删除与此集合匹配的字符</p>
<p>如果您的字符串没有那么奇怪,您可以尝试识别“字母其他”和“数字其他”类别,这将包括除超级和下标之外的其他字符。例如:</p>
<pre><code>import unicodedata
s = "¹ºUnless otherwise indicated"
cleaned = "".join(c for c in s if unicodedata.category(c) not in ["No", "Lo"])
</code></pre>