课文句式转换

2024-10-05 10:16:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我想将普通英语文本转换成maltparser的CONLL-U格式,以便在Python中查找文本中的依赖关系。我尝试了java,但没有成功,下面是我要找的格式-

String[] tokens = new String[11];
tokens[0] = "1\thappiness\t_\tN\tNN\tDD|SS\t2\tSS";
tokens[1] = "2\tis\t_\tV\tVV\tPS|SM\t0\tROOT";
tokens[2] = "3\tthe\t_\tAB\tAB\tKS\t2\t+A";
tokens[3] = "4\tkey\t_\tPR\tPR\t_\t2\tAA";
tokens[4] = "5\tof\t_\tN\tEN\t_\t7\tDT";
tokens[5] = "6\tsuccess\t_\tP\tTP\tPA\t7\tAT";
tokens[6] = "7\tin\t_\tN\tNN\t_\t4\tPA";
tokens[7] = "8\tthis\t_\tPR\tPR\t_\t7\tET";
tokens[8] = "9\tlife\t_\tR\tRO\t_\t10\tDT";
tokens[9] = "10\tfor\t_\tN\tNN\t_\t8\tPA";
tokens[10] = "11\tsure\t_\tP\tIP\t_\t2\tIP";

我尝试过java,但是我不能使用standfordapi,我希望在python中也一样。在

//这是java代码的例子,但是这里创建的令牌需要通过代码解析,而不是手动-

^{pr2}$

Tags: 文本string格式javatabtntokenstp

热门问题