一个自动获取已存档质体基因组反向重复的软件包
airpg的Python项目详细描述
airpg:获取已存档质体基因组的反向重复
一个Python包,用于自动访问存储在NCBI核苷酸上的数千个质体基因组的反向重复
安装
要获取airpg的最新稳定版本,请运行:
pip install airpg
或者,如果您想获得airpg的最新开发版本,请运行:
^{pr2}$示例用法
步骤1:生成塑性体可用性表
# Angiosperms
TESTFOLDER=./03_testing/angiosperms_Start2000toEnd2019
DATE=$(date '+%Y_%m_%d')
MYQUERY='complete genome[TITLE] AND (chloroplast[TITLE] OR plastid[TITLE]) AND 2000/01/01:2019/12/31[PDAT] AND 0000050000:00000250000[SLEN] NOT unverified[TITLE] NOT partial[TITLE] AND (Embryophyta[ORGN] AND Magnoliophyta[ORGN])'
AVAILTABLE=plastome_availability_table_${DATE}.tsv
mkdir -p $TESTFOLDER
# Defining blacklist
if [ ! -f ./BLACKLIST__master_${DATE} ]; then
cat $(ls ./BLACKLIST__* | grep -v "master") > ./BLACKLIST__master_${DATE}
fi
airpg_retrieve.py -q "$MYQUERY" -o $TESTFOLDER/$AVAILTABLE --blacklist ./BLACKLIST__master_${DATE} 1>>$TESTFOLDER/airpg_retrieve_${DATE}.runlog 2>&1
步骤2:下载记录并提取红外信息
REPRTDSTAT=reported_IR_stats_table_${DATE}.tsv
mkdir -p $TESTFOLDER/records_${DATE}
mkdir -p $TESTFOLDER/data_${DATE}
airpg_analyze.py -i $TESTFOLDER/$AVAILTABLE -r $TESTFOLDER/records_${DATE}/ -d $TESTFOLDER/data_${DATE}/ -o $TESTFOLDER/$REPRTDSTAT 1>>$TESTFOLDER/airpg_analyze_${DATE}.runlog 2>&1
变更日志
请参阅^{
- 项目
标签: