蟒蛇实现

ksx1026的Python项目详细描述


ks x 1026-1的python实现。

KS X 1026-1

KS X 1026-1是朝鲜文处理指南的韩国标准 信息交换。有更多信息 here

安装

ks x 1026 python可通过pypi获得

pip install ksx1026

或setup.py

python setup.py install

规格化

朝鲜文分解

返回给定wanseong的johab现代朝鲜文音节块 现代朝鲜文音节块

char s:单字符朝鲜文音节。否则,返回输入。

>>> from ksx1026.normalization import decomposeHangul
>>> c = "\uAC01"
>>> d = decomposeHangul(c)
>>> print(d.encode('raw_unicode_escape'))
b'\\u1100\\u1161\\u11a8'

朝鲜文成分

返回给定johab的wanseong现代朝鲜文音节块 现代朝鲜文音节块。即使是一部分古老的朝鲜文 音节块是现代朝鲜文音节块,与uax 15不同 部分未转换为万声现代朝鲜文音节块。

字符串源:Unicode字符串。

>>> from ksx1026.normalization import composeHangul
>>> source = "\u1100\u1161\u11a8"
>>> d = composeHangul(source)
>>> print(d.encode('raw_unicode_escape'))
b'\\uac01'
>>> source = "\u1100\u1161\u11c3"
>>> d = composeHangul(source)
>>> print(d.encode('raw_unicode_escape'))
b'\\u1100\\u1161\\u11c3'

朝鲜文重新编译

如果使用的是uax 15算法而不是上述复合韩语 用于规范化的函数,旧的朝鲜文音节块可以是 分解为万盛现代朝鲜文音节块和johab朝鲜文 字母。在这种情况下,申请后,可以使用 规范化中恢复字符串的重新定位算法 将NFC或NFKC格式转换为L V T格式。

字符串源:Unicode字符串

>>> from ksx1026.normalization import recomposeHangul
>>> source = "\uac00\u11c3"
>>> d = recomposeHangul(source)
>>> print(d.encode('raw_unicode_escape'))
b'\\u1100\\u1161\\u11c3'

兼容/半宽朝鲜文字母和朝鲜文嵌入符号的标准化

规范化兼容性/半宽朝鲜文字母和朝鲜文嵌入 符号(normalizejamokdkc)

字符串源:Unicode字符串

>>> from ksx1026.normalization import normalizeJamoKDKC
>>> source = "\u3200"
>>> d = normalizeJamoKDKC(source)
>>> print(d.encode('raw_unicode_escape'))
>>> b'(\\u1100\\u1160)

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在安卓中更改SeekBar颜色?(以编程方式)   java在本地测试SpringOpenShift应用程序   java为什么局部变量仍然显示警告,尽管方法中使用了值?   未解析java Spring启动验证消息   java MultiSelectListPreference是否获取检查值?   xml签名中的java引用验证   eclipse JWNL(Java WordNet库)和WordNet   java Firebase addValueEventListener是否异步工作?   单选按钮的java@FindBy注释   通过JAVA Web服务调用时,安卓 ClassNotFound异常?   java Try catch不起作用(总是执行catch代码)   为什么Eclipse在尝试导入现有java项目或创建新项目时关闭时没有任何错误消息?   java Genesys Composer应用程序与Eclipse RCP应用程序有何不同   java替换方法无法正常工作   使用JavaFX8构建java MOJO   Spark使用Java没有可用的实时SolrServer来处理此请求   Java Optaplanner在不同的机器上进行不同的计算   在类之间导入java变量   在或多个运营商SAP Java中   java Hibernate保存SQL异常