SRA到FASTQ文件通过。Python | URLError

2024-10-02 18:26:55 发布

您现在位置:Python中文网/ 问答频道 /正文

更新:主题FTP服务器已停用:[讨论](https://github.com/ewels/sra-explorer/issues/14

还有别的选择吗

我想下载.sra文件并将它们转换成.fastq文件,全部通过Python

在实现到PyCharm应用程序中之前,我正在通过Google Colaboratory运行这个程序

import wget
import sys
import os
sra_id = "SRX10360832"
url = 'ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/' + sra_id[:3] + '/' + sra_id[:6] + '/' + sra_id + '/' + sra_id + '.sra'
print(url)
print("Downloading... please wait!!")
filename = wget.download(url) # !

if filename:
  print("\nDownload Complete "+ sra_id)
  print("\nConverting...")
  cmd = 'fastq-dump ' + sra_id + '.sra'
  os.system(cmd)

在第filename = wget.download(url)行中,我得到以下错误:

error_perm: 550 sra/sra-instant/reads/ByRun/sra/SRX/SRX103/SRX10360832: No such file or directory

During handling of the above exception, another exception occurred:
URLError: <urlopen error ftp error: error_perm('550 sra/sra-instant/reads/ByRun/sra/SRX/SRX103/SRX10360832: No such file or directory')>

在url末尾包含.gz时也会发生相同的错误

这是基于Git repo的,但使用了Python的旧版本


重要的是通过下载.sra文件ftp://并将其转换为.fastq可读格式,而不使用Linux。Python不处理原始.sra文件


Tags: 文件importidurlftperrorwgetfilename