用Python为MDU编写的小工具/脚本
mdu-pytools的Python项目详细描述
MDU Python工具
背景
python中一些简单的MDU工具
工具
mdu合并ngs车道
使用它可以正确地将Illumina跑步路线与单个FASTQ车道合并。在
获取帮助:
mdu-merge-ngs-lanes --help
基本用法:
^{pr2}$高级用法:
您可以通过添加--subfolder
将输出拆分为输出文件夹的多个子文件夹
到命令行。该选项可以多次使用,并以两个空格分隔的值作为输入:
path
regex
。path
给出输出文件夹中子文件夹的名称,以及regex
表达式
确定子文件夹中的样本。在
例如,下面的命令将启动NTC的示例拆分到名为ntc
的子文件夹中,
而所有其他示例都将添加到名为data
的子文件夹中。在
mdu-merge-ngs-lanes -i /path/to/fastq -o /path/to/output --subfolder 'data''(?!NTC).*' --subfolder 'ntc''(?<=NTC).*' > cmd.sh
mdu sra上传
使用它将FASTQ数据上传到NCBI SRA。在
需要具有制表符分隔值MDU ID
和AUSMDUID
的文件。例如:
mdu1\tausmdu1
mdu2\tausmdu2
获得帮助:
mdu-sra-uploads --help
Usage: mdu-sra-upload [OPTIONS] ISOLATES Options: -f, --folder TEXT Folder on NCBI to upload. Used to find the reads when submitting via the SRA portal. [default: mdu] -r, --reads-folder TEXT Where reads are located (uses MDU_READS env variable if available). -k, --ascp-key TEXT Path to ascp ssh upload key (uses ASCP_UPLOAD_KEY env variable if available). This can be obtained from the SRA Submission Portal. -s, --sra-subfolder TEXT SRA subfolder owned by you where data will copied to (uses SRA_SUBFOLDER env variable is available). --help Show this message and exit.
基本用法:
cd /path/for/upload # copy paste isolates.txt mdu-sra-uploads isolates.txt # when completing the submission, search for pre-uploaded files in the folder called mdu
可用于设置选项的环境变量
MDU_READS
:存储FASTQ数据的完整路径ASCP_UPLOAD_KEY
:Aspera NCBI upload key所在的完整路径(从Aspera命令行说明下的SRA提交门户获取一个)SRA_FOLDER
:SRA文件夹的路径。通常由你的email
加上一个“\”和一些随机的字母数字字符组成。这可以在Aspera命令行指令下从SRA提交门户获得(例如,john.doe@doe.industries.com_qEWo9
)。在
发展
开发环境
要在相同的环境下开发,请使用vagrant
和virtualbox
:
vagrant up vagrant ssh
登录到虚拟机后,共享文件夹位于/vagrant
中。在
- 项目
标签: