将马拉雅拉姆unicode字符串音译为“Manglish”的音译算法
ml2en的Python项目详细描述
ml2(Python、Javascript、PHP)
一种将马拉雅拉姆语字母音译为罗马/拉丁字符(通常为“Manglish”)的算法,具有合理的语音公平性
抄送Nadh,2012年10月
文档:http://kailashnadh.name/code/ml2en
根据GNU GPL v2许可证授权。在
示例
输入:
星期四的后院是星期天的小地板。它向太阳方向扩展到7000万公里,达到了太阳的压制程度。星期四是太阳系行星中最强大的一个。这是太阳系中最大的组织。地球的力量,它比地球的表面越来越宽是18000年的二十倍。在
输出:
维亚扎特提恩特·卡蒂卡克谢瑟拉姆·索拉瓦认为切鲁库纳·梅哈拉莱亚恩无法相信。我们要回去睡觉,还要洗5公里的洗碗。卡恩萨特·卡恩萨特在其中一次事故中准备了一台真空吸尘器。现在,我要慢慢地泡一个泡澡。没有carnthamandalatthekkaal veethiyeriyathum paranathumia的选择不会认为他们不能相信bhoomayotethethintetthiratiyolavum vyaptham 18000 irattiyolavamanu的形状。在
为什么?在马拉雅拉姆语文字的罗马化可以很好地与语音搜索算法(例如,与变音或Soundex算法一起使用)。也有可能帮助人们学习语言。在
使用
该算法有三种不同的语言,Python、Javascript和PHP。在
Python
使用pip3 install ml2en
安装
fromml2enimportml2enprint(ml2en.transliterate(ml_str))
Javascript
^{pr2}$PHP
<?phprequire'ml2en.php';$result=ml2en::transliterate($ml_str);?>
- 项目
标签: