工具从bigcode生成和可视化嵌入

bigcode-embeddings的Python项目详细描述


#bigcode嵌入

注意:数据必须使用[bigcode ast tools][2]生成,才能使用 此工具

bigcode embeddings允许为 AST节点。

##安装

此项目应与Python3一起使用。

要安装软件包,请运行

` pip install bigcode-embeddings `

或者克隆存储库并运行

` cd bigcode-embeddings pip install -r requirements.txt python setup.py install `

注:TensorFlow需要单独安装。

用法

###嵌入式训练

训练数据可以使用[bigcode ast tools][2]

给定从30000大小的词汇表生成的data.txt.gz, 可以使用

` ./bin/bigcode-embeddings train -o embeddings/ --vocab-size 30000 --emb-size 100 --l2-value 0.05 --learning-rate 0.01 data.txt.gz `

[tensorboard][2]可用于可视化进度

` tensorboard --logdir embeddings/ `

在第一个纪元之后,嵌入可视化从 张力板。由bigcode ast tools生成的词汇表tsv文件可以 在嵌入件上贴标签。

###可视化嵌入

可以使用visualize子命令可视化经过训练的嵌入 如果生成的词汇文件是vocab.tsv,则上述嵌入 可以使用以下命令进行可视化

` ./bin/data-explorer visualize clusters -membeddings/embeddings.bin-STEP-l vocab.tsv `

其中,步骤应该是在embeddings/目录中找到的最大值。

可以通过-i标志生成交互式绘图。

[1]:../bigcode ast tools/README.md [2]:https://github.com/tensorflow/tensorboard

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
分析线程“main”java中的异常。时间总体安排DateTimeParseException:未能在索引0处分析文本“”   java为什么术语“工作单元”如此重要,为什么JDBC自动提交违反了这种模式?   java您的SQL语法有错误,但查询在MySQL工作台中运行   如何将api post请求从Java写入c#   java集成Hbase和Hive的优势是什么   使用Ecplise从数据库检索列表时遇到问题的java   java使用Guice需要做什么?   java在控制器中使用@Autowired和@Qualifier更改服务的数据源   通过Java API将具有值的字段添加到MongoDB中的现有文档中   java设置了JFrame背景,为什么这不起作用?   java和安卓中的异常处理   java如何在glassfish服务器中配置oracle精简连接池?   java如何使用spring@Lookup注释?   java Log4J调试不起作用?   java有没有人有一个好的代码示例/库,可以通过S3预签名的URL执行大文件(5GB)PUT操作?   java如何避免“除非模拟类型是可注入的或动态的,否则无法进入方法”?   浮点Java IEEE 754浮点到IBM浮点字节[4]转换