解密SENNA Chunk、SRL和解析器输出

alvas@ubi:~/senna$ ./senna-linux64 --help invalid argument: --help SENNA Tagger (POS - CHK - NER - SRL) (c) Ronan Collobert 2009 Usage: ./senna-linux64 [options] Takes sentence (one line per sentence) on stdin Outputs tags on stdout Typical usage: ./senna-linux64 [options] < inputfile.txt > outputfile.txt Display options: -h Display this help -verbose Display model informations on stderr -notokentags Do not output tokens -offsettags Output start/end offset of each token -iobtags Output IOB tags instead of IOBES -brackettags Output 'bracket' tags instead of IOBES Data options: -path <path> Path to the SENNA data/ and hash/ directories [default: ./] Input options: -usrtokens Use user's tokens (space separated) instead of SENNA tokenizer SRL options: -posvbs Use POS verbs instead of SRL style verbs for SRL task -usrvbs <file> Use user's verbs (given in <file>) instead of SENNA verbs for SRL task Tagging options: -pos Output POS -chk Output CHK -ner Output NER -srl Output SRL -psg Output PSG

alvas@ubi:~/senna$ ./senna-linux64 -pos < test.in Foo NNP went VBD to TO eat VB bar NN at IN the DT Foobar NNP . .

alvas@ubi:~/senna$ ./senna-linux64 -ner < test.in Foo S-PER went O to O eat O bar O at O the O Foobar S-LOC . O

alvas@ubi:~/senna$ ./senna-linux64 -chk < test.in Foo S-NP went B-VP to I-VP eat E-VP bar S-NP at S-PP the B-NP Foobar E-NP . O

alvas@ubi:~/senna$ ./senna-linux64 -srl < test.in Foo - S-A1 S-A0 went went S-V O to - B-AM-PNC O eat eat I-AM-PNC S-V bar - I-AM-PNC S-A1 at - I-AM-PNC B-AM-LOC the - I-AM-PNC I-AM-LOC Foobar - E-AM-PNC E-AM-LOC . - O O

alvas@ubi:~/senna$ ./senna-linux64 -psg < test.in Foo (S1(S(NP*) went (VP* to (S(VP* eat (VP* bar (ADVP*) at (PP* the (NP* Foobar *)))))) . *))

1条回答

网友

1楼 · 发布于 2024-09-27 19:13:52

SENNA使用CoNLL格式。你可以在这里阅读：http://universaldependencies.github.io/docs/format.html

这是相当普遍的，周围有很多转换器。在

至于前缀，它们的意思是：S-单例表达式和B-开始I-中间E-多单词表达式的结尾。在

然后是语义角色标注的输出。寻找关于SRL的更多信息，因为这会变得更加复杂。注意这里有两列，一列是动词go，另一列是动词eat。通常A0是主语，A1是直接宾语（同样，过于简单化）。AM是自变量修饰语，-LOC是一个位置（可以是其他副词）。PNC似乎指代名词短语充当动词go的宾语。从我脑子里就不记得了。此处为示例verbs.colorado.edu/propbank/framesets-英语/go-v.html 至于解析树，它被放在方括号内，也是一种受Lisp启发的通用符号。*表示当前令牌的标签。我发现这个很有用：https://math.stackexchange.com/questions/588230/how-to-convert-parentheses-notation-for-trees-into-an-actual-tree-drawing

相关问题更多 >

编程相关推荐

热门问题

热门文章