python中的ESA实现。
argument-esa-model的Python项目详细描述
获取所需资源
scp-rwebis@webislab40.medien.uni-weimar.de:/home/weci2587/projects/args主题建模/资源。在
要使用所有术语运行ESA脚本,请执行以下操作:
对于正常ESA:
./esa-all-terms.py --similarity cos
--matrix-path <path_to_resources>/resources/esa-plain/<debatepedia|strategic-intelligence|wikipedia>.mat
--model-path <path_to_resources>/resources/esa-w2v/GoogleNews-vectors-negative300.bin
--model-vocab <path_to_resources>/resources/esa-w2v/w2v-vocab.p
--input-path <path_to_input_file>
--output-path <path_to_output_file>
对于word2vec ESA:
^{pr2}$要运行word2vec ESA with reduced terms,请运行:
./esa-top-n-terms.py -n <number_of_terms>
--corpus-path <path_to_resources>/resources/corpora/<debatepedia|strategic-intelligence|wikipedia>.csv
--model-path <path_to_resources>/resources/esa-w2v/GoogleNews-vectors-negative300.bin
--model-vocab <path_to_resources>/resources/esa-w2v/w2v-vocab.p
--input-path <path_to_input_file>
--output-path <path_to_output_file>
输入文档必须是以“|”作为分隔符的csv文件,并且必须包含列“document”,该列用作ESA的输入文本。在
- 项目
标签: