python3注释程序选择每个位点的最佳基因模型
Mikado的Python项目详细描述
天皇是一条轻便的Python3管道,其目的是便于识别 从rna序列数据中选择表达位点,并在每个位点中选择最佳模型。
管道的逻辑如下:
在第一步中,解析注释(以gtf/gff3格式提供)以定位相同链上重叠特征的超位点。
这些超位点被分成不同的subloci,每一个都定义如下:
- For multiexonic transcripts, to belong to the same sublocus they must share at least a splicing junction (i.e. an intron)
- For monoexonic transcripts, they must overlap for at least one base pair
- All subloci must contain either only multiexonic or only monoexonic transcripts
在每个子文档中,管道根据用户定义的优先级方案选择最佳转录本。
产生的monosubloci合并到monosubloci\u holders
选择最佳的非重叠转录本,以定义包含在超位点内的位点。
- At this stage, monoexonic and multiexonic transcript are checked for overlaps
- Moreover, two multiexonic transcripts are considered to belong to the same locus if they share a splice site (not junction)
一旦确定了位点,程序就会回溯并寻找能够明确分配到单个位点的转录本,并构成主转录本的有效的选择性剪接亚型。
用于选择“best”转录本的条件由用户自行决定,使用特定的配置文件。