python中的ESA实现。

argument-esa-model的Python项目详细描述


获取所需资源

scp-rwebis@webislab40.medien.uni-weimar.de:/home/weci2587/projects/args主题建模/资源。在

要使用所有术语运行ESA脚本,请执行以下操作:

对于正常ESA:

./esa-all-terms.py  --similarity cos
                    --matrix-path <path_to_resources>/resources/esa-plain/<debatepedia|strategic-intelligence|wikipedia>.mat
                    --model-path <path_to_resources>/resources/esa-w2v/GoogleNews-vectors-negative300.bin
                    --model-vocab <path_to_resources>/resources/esa-w2v/w2v-vocab.p
                    --input-path <path_to_input_file>
                    --output-path <path_to_output_file>

对于word2vec ESA:

^{pr2}$

要运行word2vec ESA with reduced terms,请运行:

./esa-top-n-terms.py    -n <number_of_terms> 
                        --corpus-path <path_to_resources>/resources/corpora/<debatepedia|strategic-intelligence|wikipedia>.csv
                        --model-path <path_to_resources>/resources/esa-w2v/GoogleNews-vectors-negative300.bin
                        --model-vocab <path_to_resources>/resources/esa-w2v/w2v-vocab.p
                        --input-path <path_to_input_file>
                        --output-path <path_to_output_file>

输入文档必须是以“|”作为分隔符的csv文件,并且必须包含列“document”,该列用作ESA的输入文本。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java未能实例化[org.springframework.web.servlet.HandlerMapping]:工厂方法“resourceHandlerMapping”引发异常;没有ServletContext集   date Java 8–使用时区从LocalDateTime创建即时   带有BigInteger的Java hmacSHA256与C不同#   java线在未最大化时绘制在错误的位置   java错误:数据源拒绝建立连接,来自服务器的消息:“连接太多”   java Beanio:如何根据另一个字段值验证字段?   java SonarQube无法连接到>本地主机/0:0:0:0:0:0:0:1:9000   JavaLucene实现对相关性的自定义评分   排序java。lang.IllegalArgumentException:比较方法违反了它的通用合同java。base/java。util。蒂姆索特。合并崩溃   java处理来自另一个类的按钮按下   java未检测到短电源按钮按下   java需要在另一个具有RecyclerView的活动中使用复选框放置所选(多个)RecyclerView项行   java捆绑包的激活器无效