将Edit字典格式转换为CSV。

edict-to-csv的Python项目详细描述


Edit to CSV是一组用于转换Edit的小型命令行实用程序 将词典转换为分隔文本(CSV)。与许多unix命令一样,这些命令 程序只需读取标准输入并写入标准输出。 提供两个程序:

  • CEDICT到CSV(1)
  • edict1到csv(1)

edict1到csv将字典条目从使用的原始edict1格式转换为 通过jmdict/edict项目。它不处理edict2格式或随后的 基于XML的格式。

cedict to csv将词典条目从cedict项目转换为 CC-CEDICT公司。要使用此程序,必须安装“拼音DEC”软件。 这将重新格式化拼音条目以使用适当的变音符号。

csv条目采用以下格式:

FORM1|FORM2|TRANSLITERATION|DEFINITION

就法令而言,第二个字段总是空的。对于CEDICT,第二个 字段包含简体中文形式。

所包含的程序是作为unix风格的命令行实用程序编写的。这个 程序模块也可以通过python完全访问,所以所有的程序 其他程序可以很容易地调用函数。程序是用 python 3和将在mit许可下提供。

示例用法

您可以这样转换日语法令词典:

$ cat edict.utf8 | edict1-to-csv > edict.csv

如果它是压缩的并且是euc-jp编码,您可能需要将其转换:

$ zcat edict.gz | iconv -f EUC-JP -t UTF-8 | edict1-to-csv > edict.csv

您可以这样转换cc-cedict:

$ cat cedict.txt | cedict-to-csv > cedict.csv

如果您尝试在不安装拼音DEC的情况下使用此程序,您将看到:

$ cat cedict.txt | cedict-to-csv > cedict.csv
cedict-to-csv: pinyin_dec not available!

安装

您可以使用setup.py以旧方式安装此软件:

# python3 setup.py install

或者如果你安装了pip,那是更好的方法。

文档

此软件包括Unix手册页,这些手册页与程序一起安装 文件夹。通过键入“man cedict to csv”或“man edict1 to csv”,您可以查看 这里包括每个程序的文档。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java WLPs微文件(容错)超时实现不中断线程?   使用Jsoup对网页进行java解析。为什么Android上的行为有所不同?   java全屏安卓应用程序功能   java有没有一种方法可以将自定义对象列表放入cloudfirestore中的自定义对象中   平滑后的javagps数据比较   使用Java8谓词查找“最”正确值的函数式编程   java调整JFrame的大小(当子对象调整大小时):如何跟上?   if语句中的java条件   java如何配置JSP应用程序在Jboss和Tomcat上透明地处理JNDI   java如何在spring boot中验证@RequestHeader是否为null?   java从URL检索XML时不写入前几行   java在重写的paintComponent(…)中旋转图像方法   java Android透明GradientDrawable在emulator上变灰   java如何编辑PostgreSQL的Oracle 11G设置   java JAXb在解组期间未填充对象   java重新启动了响应。getBody()。getList(<ListName>)正在返回一个空集合   PHP和Java在能耗方面有什么不同?   没有源属性但嵌入html标记的java iFrame   java JTable导致我的应用程序崩溃