Python中文网

Python stringprep

cnpython399

在因特网协议中,经常需要比较标识(例如主机名)是否相等。在不同的应用场景下,比较可能会考虑大小写敏感性等因素。有时候还需要限制允许的标识只包含“可打印”字符。

RFC 3454 定义了在因特网协议中处理 Unicode 字符串的“预备”过程。在传输字符串之前,它们会先经过预备过程,以获得特定的标准形式。该 RFC 定义了一系列表格,可以根据选项配置进行组合。每个配置都必须定义使用的表格,stringprep 过程中的其他可选项也是配置的一部分。举个例子,nameprep 是一种配置,用于处理国际化域名。

模块 stringprep 公开了 RFC 3454 中的表格,但不是以数据结构的形式,而是以函数的形式提供。在 RFC 中,有两种类型的表格:集合和映射。对于集合,stringprep 提供了“特征函数”,即用于检查给定字符是否属于集合的函数,如果属于则返回 True。对于映射,它提供了映射函数:根据给定的键返回与之关联的值。下面是模块中所有可用函数的列表。

stringprep.in_table_a1(code) 判断给定字符 code 是否属于 tableA.1(Unicode 3.2 中的未分配码位)。

stringprep.in_table_b1(code) 判断给定字符 code 是否属于 tableB.1(通常映射为空值)。

stringprep.map_table_b2(code) 根据 tableB.2(与 NFKC 配合使用的大小写转换映射)将给定字符 code 进行映射。

stringprep.map_table_b3(code) 根据 tableB.3(不包含规范化的大小写折叠映射)将给定字符 code 进行映射。

stringprep.in_table_c11(code) 判断给定字符 code 是否属于 tableC.1.1(ASCII 空白字符)。

stringprep.in_table_c12(code) 判断给定字符 code 是否属于 tableC.1.2(非 ASCII 空白字符)。

stringprep.in_table_c11_c12(code) 判断给定字符 code 是否属于 tableC.1(空白字符,包含 C.1.1 和 C.1.2 的并集)。

stringprep.in_table_c21(code) 判断给定字符 code 是否属于 tableC.2.1(ASCII 控制字符)。

stringprep.in_table_c22(code) 判断给定字符 code 是否属于 tableC.2.2(非 ASCII 控制字符)。

stringprep.in_table_c21_c22(code) 判断给定字符 code 是否属于 tableC.2(控制字符,包含 C.2.1 和 C.2.2 的并集)。

stringprep.in_table_c3(code) 判断给定字符 code 是否属于 tableC.3(私有使用)。

stringprep.in_table_c4(code) 判断给定字符 code 是否属于 tableC.4(非字符码位)。

stringprep.in_table_c5(code) 判断给定字符 code 是否属于 tableC.5(替代代码)。

stringprep.in_table_c6(code) 判断给定字符 code 是否属于 tableC.6(不适用于纯文本)。

stringprep.in_table_c7(code) 判断给定字符 code 是否属于 tableC.7(不适用于规范表示)。

stringprep.in_table_c8(code) 判断给定字符 code 是否属于 tableC.8(改变显示属性或已弃用)。

stringprep.in_table_c9(code) 判断给定字符 code 是否属于 tableC.9(标记字符)。

stringprep.in_table_d1(code) 判断给定字符 code 是否属于 tableD.1(带有双向属性 "R" 或 "AL" 的字符)。

stringprep.in_table_d2(code) 判断给定字符 code 是否属于 tableD.2(带有双向属性 "L" 的字符)。

以上是 stringprep 模块中所有可用的函数,它们用于处理字符串的预备过程,确保它们符合因特网协议的要求。