对话TP2列车/发电机

dialogpt2的Python项目详细描述


声明

我把这个notebook转换成了一个包。在

要求

安装huggingface:)

安装此repo

pip install dialogpt2

使用

有两个脚本和一个类。在

列车

$ dialogpt2-train --help
usage: dialogpt2-train [-h] --input_file INPUT_FILE [--line_sep LINE_SEP][--qa_sep QA_SEP][--output_dir OUTPUT_DIR][--model_name_or_path MODEL_NAME_OR_PATH][--config_name CONFIG_NAME][--tokenizer_name TOKENIZER_NAME][--cache_dir CACHE_DIR][--block_size BLOCK_SIZE][--do_train][--do_eval][--evaluate_during_training][--per_gpu_train_batch_size PER_GPU_TRAIN_BATCH_SIZE][--per_gpu_eval_batch_size PER_GPU_EVAL_BATCH_SIZE][--gradient_accumulation_steps GRADIENT_ACCUMULATION_STEPS][--learning_rate LEARNING_RATE][--weight_decay WEIGHT_DECAY][--adam_epsilon ADAM_EPSILON][--max_grad_norm MAX_GRAD_NORM][--num_train_epochs NUM_TRAIN_EPOCHS][--max_steps MAX_STEPS][--warmup_steps WARMUP_STEPS][--logging_steps LOGGING_STEPS][--save_steps SAVE_STEPS][--save_total_limit SAVE_TOTAL_LIMIT][--eval_all_checkpoints][--no_cuda][--overwrite_output_dir][--overwrite_cache][--should_continue][--seed SEED][--local_rank LOCAL_RANK][--fp16][--fp16_opt_level FP16_OPT_LEVEL]

optional arguments:
  -h, --help            show this help message and exit
  --input_file INPUT_FILE, -i INPUT_FILE
                        Input file is a list lines that contain a single
                        question and a single answer.
  --line_sep LINE_SEP   Line separation token
  --qa_sep QA_SEP       Token that separates question with an answer
  --output_dir OUTPUT_DIR
                        Output-dir of the model
  --model_name_or_path MODEL_NAME_OR_PATH
  --config_name CONFIG_NAME
  --tokenizer_name TOKENIZER_NAME
  --cache_dir CACHE_DIR
  --block_size BLOCK_SIZE
  --do_train
  --do_eval
  --evaluate_during_training
  --per_gpu_train_batch_size PER_GPU_TRAIN_BATCH_SIZE
  --per_gpu_eval_batch_size PER_GPU_EVAL_BATCH_SIZE
  --gradient_accumulation_steps GRADIENT_ACCUMULATION_STEPS
  --learning_rate LEARNING_RATE
  --weight_decay WEIGHT_DECAY
  --adam_epsilon ADAM_EPSILON
  --max_grad_norm MAX_GRAD_NORM
  --num_train_epochs NUM_TRAIN_EPOCHS
  --max_steps MAX_STEPS
  --warmup_steps WARMUP_STEPS
  --logging_steps LOGGING_STEPS
  --save_steps SAVE_STEPS
  --save_total_limit SAVE_TOTAL_LIMIT
  --eval_all_checkpoints
  --no_cuda
  --overwrite_output_dir
  --overwrite_cache
  --should_continue
  --seed SEED
  --local_rank LOCAL_RANK
  --fp16
  --fp16_opt_level FP16_OPT_LEVEL

发电机

^{pr2}$

对话pt

fromdialogpt2importDialoGPT2gpt=DialoGPT2(model_name_or_path='microsoft/DialoGPT-small',cuda_device=None,use_context=False)gpt.gen('Could you image someone building a repo about you?')

示例

$ dialogpt2-gen -i
User >> Who made you?
Bot >> I'm not sure I follow...User >> ShameBot >> You are a very sad person.User >> Don't judge so fast 
Bot >> The judge said that?
User >> Shut up 
Bot >> What a nice way to get a ring.
User >> AAAAA
Bot >> AA
User >> A
Bot >> 
User >> AAAAAAAAAAAAAAA
Bot >> He's a good looking guy.
User >> 

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
多线程Java线程不断累积   java LibGDX:移动/设置动画时跟踪节点   java如何按页面导航?   java重定向来自从父类继承记录器的抽象子类的记录器消息   在Java中拆分包含(   java如何将这样的sql查询转换为mongodb查询   java将图像上载到blobstore   java只在JTable的一个单元格中添加许多JButton   基于反射的事件系统的java替代方案?   java从google scholar下载多个pdf文件   当文件系统中不存在属性文件时,java ResourceBundle无法计算如何读取属性文件   java使用http读取xml文件   java新的Android版本将与旧的WebView文件选择器方法兼容