给定一个可以包含日语和英语文本的字符串,我想:
- 将日语部分从平假名转换为片假名,半宽转换为全宽。你知道吗
- 按单词拆分字符串(日语文本不使用空格分隔单词)
我目前正在使用优秀的iOS/osx字符串库(它可以满足数百种复杂情况和边缘情况)。你知道吗
具有kCFStringTransformHiraganaKatakana
常数的^{}。你知道吗
具有NSStringEnumerationByWords
常数的^{}。你知道吗
搜索正在从客户端移动到服务器,因此我们需要这些方法的PHP或Python版本。你知道吗
Tags:
可能是nltkjp或tiny segmenter,两者都与nltk兼容, 对于日语语料库,您可以访问Masato Hagiwara网站。你知道吗
相关问题 更多 >
编程相关推荐