我使用chromium compact语言检测器来检测语言,但它无法检测字符串中的日语。在
text = '1/15 HR Div.Q&CS Dept. 全体MTG 開催
1月15日(水)、赤溜オーディトリアムにてHR Div.Q&CS Dept.の全体MTGが開催されました。 '
cld.detect(smart_str(text), pickSummaryLanguage=True, removeWeakMatches=False)
output: ('ENGLISH', 'en', True, 11, [('ENGLISH', 'en', 100, 0.8103727714748784)])
欢迎提出建议。在
您可能需要首先将该日语字符串编码为UTF8,例如。 试试这个:
我想
cld
不能检测到日语。它的新版本称为cld2
。请在此处检查:https://code.google.com/p/cld2/wiki/CLD2FullVersion
相关问题 更多 >
编程相关推荐