文言文的标记器pos标记和依存分析器

udkanbun的Python项目详细描述


Current PyPI packages

UD堪布

文言文的标记器、词性标记器和依存分析器,致力于Universal Dependencies

基本用法

>>>importudkanbun>>>lzh=udkanbun.load()>>>s=lzh("不入虎穴不得虎子")>>>print(s)# text = 不入虎穴不得虎子1ADVv,副詞,否定,無界Polarity=Neg2advmod_Gloss=not|SpaceAfter=No2VERBv,動詞,行為,移動_0root_Gloss=enter|SpaceAfter=No3NOUNn,名詞,主体,動物_4nmod_Gloss=tiger|SpaceAfter=No4NOUNn,名詞,固定物,地形Case=Loc2obj_Gloss=cave|SpaceAfter=No5ADVv,副詞,否定,無界Polarity=Neg6advmod_Gloss=not|SpaceAfter=No6VERBv,動詞,行為,得失_2parataxis_Gloss=get|SpaceAfter=No7NOUNn,名詞,主体,動物_8nmod_Gloss=tiger|SpaceAfter=No8NOUNn,名詞,,関係_6obj_Gloss=child|SpaceAfter=No>>>t=s[1]>>>print(t.id,t.form,t.lemma,t.upos,t.xpos,t.feats,t.head.id,t.deprel,t.deps,t.misc)1ADVv,副詞,否定,無界Polarity=Neg2advmod_Gloss=not|SpaceAfter=No

udkanbun.load()只有一个选项udkanbun.load(MeCab=False)。默认情况下,ud kanbun管道使用MeCab作为标记器和pos标记器,然后使用UDPipe作为依赖性解析器。使用选项MeCab=False,管道在整个处理过程中使用udpipe。

安装

binary wheel可用于linux,并且在使用pip

时默认安装。
pip install udkanbun

作者

小泉纯一郎(koichi yasuoka)

参考文献

  • 安岡孝一: 四書を学んだMeCab+UDPipeはセンター試験の漢文を読めるのか, 東洋学へのコンピュータ利用, 第30回研究セミナー (2019年3月8日), pp.3-110.

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用字符而不是字符串的意义   部分匹配长度字符串相似性的java正则表达式   java获取构造函数错误(错误:“(”或“[”)   java@Value注释无法正常工作SpringBoot   java hasKey在响应中没有看到字段   java JavaFX,没有JFXButtons和所有   在Log4j2中,是否可以根据键从记录器中筛选出某些键值对?   如何使用Java中Kafka的消息,从特定偏移量开始   java在单击后存储动态按钮的值   java Android编码:ViewRootImpl$CalledFromErrorThreadException。[Noob]   通过FileChooser保存pdf格式会提示在java中出现第二个对话框   用于空文件的java Spring集成文件标记   java我们应该如何编写get方法,以便私有字段不会超出其预期范围?   java Eclipse产品问题,Juno RequireHandle:org。日食e4。果心服务