在unicode中选择字符范围

2024-06-28 20:37:05 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我想通过一个字符串进行解析并删除某个范围以上的任何字符,例如,如果我想删除字符串中的所有表情符号。例如,在python中用IDLE打印文本,BMP范围不包括emojis,如果您尝试,就会抛出一个错误。联机解决此错误的常见方法是:

"".join((i if ord(i) < 10000 else '\ufffd' for i in s))

其中10000是字符限制,超过此限制的所有字符将变为unicode替换字符�.

为什么是一万Another solution online with this exact code uses 65000

我该如何选择我想要的角色限制?在我的情况下,对于python3

我想你会根据一些python文档说的BMP限制,但是我找不到,那么什么是一个现实的限制,它将包括所有重要的字符,例如数字和字母,例如一个包含超出范围字符的句子,仍然可以理解

谢谢,抱歉英语不好,我不能很好地解释我的问题


Tags: 方法字符串文本if错误联机字符else