将folia和tei文件转换为alpino xml文件

corpus2alpino的Python项目详细描述


Build Status

folia和tei到alpino xml

FoLiATEIxml文件转换为Alpinoxml文件。输入文件中的每个句子都是单独分析的。

用法

命令行

pip install corpus2alpino
corpus2alpino -s localhost:7001 folia.xml -o alpino.xml

或来自项目根目录:

python -m corpus2alpino -s localhost:7001 folia.xml -o alpino.xml

fromcorpus2alpino.converterimportConverterfromcorpus2alpino.annotators.alpinoimportAlpinoAnnotatorfromcorpus2alpino.collectors.filesystemimportFilesystemCollectorfromcorpus2alpino.targets.memoryimportMemoryTargetfromcorpus2alpino.writers.lassyimportLassyWriteralpino=AlpinoAnnotator("localhost",7001)converter=Converter(FilesystemCollector(["folia.xml"]),# Not needed when using the PaQuWriterannotators=[alpino],# This can also be ConsoleTarget, FilesystemTargettarget=MemoryTarget(),# Set to merge treebanks, also possible to use PaQuWriterwriter=LassyWriter(True))# get the Alpino XML output, combined into one treebank XML fileparses=converter.convert()print(''.join(parses))# <treebank><alpino_ds ... /></treebank>

单元测试

python -m unittest

上传到pypi

见:https://packaging.python.org/tutorials/packaging-projects/#generating-distribution-archives

确保安装了setuptoolswheel。然后从virtualenv:

python setup.py sdist bdist_wheel
twine upload dist/*

要求

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
SpringMVC中的java,当我遇到旋度时,SpringMVC中出现错误   java如何从设备获取默认ip地址?   plink运行autosys批处理作业并检查其在java中的状态   java Json数组对象通过控制器[Spring Boot]传递到模型   netbeans将java命令行参数传递给插件   java Android AIDL gen文件导致警告?   java JAXB阻止JAXB与共享实体序列化   由@JsonIdentityInfo序列化的对象的java反序列化   postgresql java数组插入postgres   Java圆环碰撞检测   在Java中提取JSON键名   jdk1中的java内存泄漏。7   java Spring 3@Autowired注释问题