在mip管道中进行继承分析和评分的新工具。
mip_family_analysis的Python项目详细描述
#mip家族分析
mip管道家族设置中的变体分析工具。
根据遗传模型、种群频率等对所有变体进行注释和评估。
仅在python版本2.7中检查用法。
mip_family_analysis需要*pip*才能正确安装。
要安装,运行
```
pip install mip廑u family廑analysis
````````
````````
`````````
``````
从下到上:
存储特定于个体的变异基因型信息
存储特定于个体的变异基因型信息
存储特定于个体的变异基因型信息
存储变异基因信息,以及变异基因在*家族中的特定行为
存储变异基因信息,以及变异基因在*家族中的特定行为。个人持有信息关于个体和个体特定基因型。
*有*
*基因型
包括所有的家族成员和这个家族所有变体的结合。
*has*
*individual
*variant
基因型代表我们在一个位置上看到的两个等位基因。
0代表参考序列,1是第一个备选等位基因,2是第二个备选等位基因,依此类推。
如果没有进行相位调整,基因型是x/x形式上的无序对,所以0/1意味着个体在这个给定的位置上是杂合子,参考基在一个等位基因上,而第一个等位基因在另一个等位基因上。
2/2意味着我们在两个等位基因上都看到了第二个等位基因。
有些染色体只存在于人类,这里只允许用一个数字来显示基因型。0表示参考,1表示备选方案。
0 1或1 0.
两个等位基因都需要有变异才能使个体患病,因此健康个体不能是纯合的选择,而患病个体必须是纯合的选择。如果个人健康:
*可以是承运人,所以0/1可以
*可以有ref呼叫或没有呼叫,所以0/0和./。可以
*不能是纯合子替代,因此1/1不可以。
2。如果个人生病:
*不能是携带者,因此0/1不正常。
*不能有ref call 0/0不正常
*必须是纯合子替代品,因此1/1,2/2,…如果父母是杂合子,则可以,否则变体遵循常染色体隐性从头开始。
*不调用,./,因为我们不能以此排除该模型。
基因型缺失。
如果个人健康:
*不能作为承运人,因此0/1不正常
*可以有ref呼叫或没有呼叫,因此0/0和./。正常
*不能纯合子,因此1/1不正常。
2。如果个体有病:
*可以杂合子,所以0/1可以,应该在任何一个父母中找到,否则从头开始。
*不能有ref调用,所以0/0不可以
*可以是纯合子替代品,所以1/1,2/2,…如果父母是病态杂合子或受影响的纯合子,则可以,否则个体将遵循常染色体显性从头。
显性从头
与上述相同,但不同的是,一个或两个亲本缺失基因型。
要使两个变体成为复合对,它们必须同时出现在受影响的个体中,但不能同时出现在任何健康个体中。否则,变异遵循复合杂合子从头开始的模式。
如果我们没有来自个体的相位信息,也就是说,如果我们还没有确定我们所观察的变异位于哪个等位基因上,我们就不能说一对是有害的还是有害的。如果个人健康:
*可以是承运人,所以0/1可以
*可以有ref呼叫或没有呼叫,所以0/0和./。可以
*不能是纯合子替代,因此1/1不可以。
2。如果个人生病:
*可以是携带者,因此0/1不正常。
*不能有ref呼叫,0/0不正常。
*必须确保每个父母在每个潜在配对中携带一个(并且只有一个)变体。
*不打电话,./。,因为我们不能用这个方法排除这个模型,所以我们可以这样做。
是的女人有两个。这意味着女性的可以携带,但男性会受到影响,如果他们得到变异。很少有女性患上这种疾病,因为她们必须从双亲那里继承一种变体,这意味着父亲必须生病。
1.如果个人健康:
*如果女性:可以是携带者所以0/1可以
*如果男性:不能是携带者所以0/1不可以
*可以有ref呼叫或没有呼叫所以0/0和./。可以
*不能是纯合子替代,因此1/1不可以。
2。如果个人生病:
*如果女性:可以是承运人,因此0/1不正常。
*不能有ref呼叫,0/0不正常
*不呼叫,./。可以,因为我们不能以此排除模型。
x linked de novo 35 35 35 35 35 \35 35 35 \\基因型###
存储特定于个体的变体的基因型信息*筛选字符串
*ref_depth int
*alt_depth int
*具有int
*深度覆盖度的phred-likelihoods元组
*深度覆盖度int
*基因型质量浮点
*start int
*stop int
*ref string reference nucleotide
*alt string alternative sequence
*identity string dbsnp id
*var_info dict包含变量文件中所有信息的字典
*qual string基本调用分数的值
*filter string筛选状态
*基因型列出此变体的基因型列表
*基因串分号分隔字符串,具有集合基因名
*如果遵循常染色体显性模式,则为ad bool
*如果遵循常染色体显性新模式,则为ad dn bool
*如果遵循常染色体显性新模式,则为ar bool遵循常染色体隐性模式遵循常染色体隐性去新模式
*ar_comp bool如果遵循常染色体隐性复合模式
*ar_comp dn bool如果遵循常染色体隐性复合去新模式
**方法**
*get_variant(self):
stdout
*打印模型信息(self):
为每个变量打印它们遵循的继承模式。
*打印vcf变量(self):
以vcf格式打印变量到stdout
*打印原始版本(self,头列:
按原始格式打印变量。
*check_noncomplete_call(self):
检查gatk是否漏报了一些信息。
*get_genetime(self):
返回包含此变量基因型的列表。
关于个体和个体特定基因型。
**属性**
*ind字符串可以是家族中唯一的任何id
*家族字符串可以是队列中唯一的id
*母亲字符串是母亲的ind或[0,-9]如果信息缺失
*父字符串--------基因型>;}
*相位bool如果基因型信息包括此个体的相位
}
*variants dict dictionary,其中包含{<;var_id>;:<;variant>;}形式的系列中存在的所有变体
mip管道家族设置中的变体分析工具。
根据遗传模型、种群频率等对所有变体进行注释和评估。
仅在python版本2.7中检查用法。
mip_family_analysis需要*pip*才能正确安装。
要安装,运行
```
pip install mip廑u family廑analysis
````````
````````
`````````
``````
从下到上:
存储特定于个体的变异基因型信息
存储特定于个体的变异基因型信息
存储特定于个体的变异基因型信息
存储变异基因信息,以及变异基因在*家族中的特定行为
存储变异基因信息,以及变异基因在*家族中的特定行为。个人持有信息关于个体和个体特定基因型。
*有*
*基因型
包括所有的家族成员和这个家族所有变体的结合。
*has*
*individual
*variant
基因型代表我们在一个位置上看到的两个等位基因。
0代表参考序列,1是第一个备选等位基因,2是第二个备选等位基因,依此类推。
如果没有进行相位调整,基因型是x/x形式上的无序对,所以0/1意味着个体在这个给定的位置上是杂合子,参考基在一个等位基因上,而第一个等位基因在另一个等位基因上。
2/2意味着我们在两个等位基因上都看到了第二个等位基因。
有些染色体只存在于人类,这里只允许用一个数字来显示基因型。0表示参考,1表示备选方案。
0 1或1 0.
两个等位基因都需要有变异才能使个体患病,因此健康个体不能是纯合的选择,而患病个体必须是纯合的选择。如果个人健康:
*可以是承运人,所以0/1可以
*可以有ref呼叫或没有呼叫,所以0/0和./。可以
*不能是纯合子替代,因此1/1不可以。
2。如果个人生病:
*不能是携带者,因此0/1不正常。
*不能有ref call 0/0不正常
*必须是纯合子替代品,因此1/1,2/2,…如果父母是杂合子,则可以,否则变体遵循常染色体隐性从头开始。
*不调用,./,因为我们不能以此排除该模型。
基因型缺失。
如果个人健康:
*不能作为承运人,因此0/1不正常
*可以有ref呼叫或没有呼叫,因此0/0和./。正常
*不能纯合子,因此1/1不正常。
2。如果个体有病:
*可以杂合子,所以0/1可以,应该在任何一个父母中找到,否则从头开始。
*不能有ref调用,所以0/0不可以
*可以是纯合子替代品,所以1/1,2/2,…如果父母是病态杂合子或受影响的纯合子,则可以,否则个体将遵循常染色体显性从头。
显性从头
与上述相同,但不同的是,一个或两个亲本缺失基因型。
要使两个变体成为复合对,它们必须同时出现在受影响的个体中,但不能同时出现在任何健康个体中。否则,变异遵循复合杂合子从头开始的模式。
如果我们没有来自个体的相位信息,也就是说,如果我们还没有确定我们所观察的变异位于哪个等位基因上,我们就不能说一对是有害的还是有害的。如果个人健康:
*可以是承运人,所以0/1可以
*可以有ref呼叫或没有呼叫,所以0/0和./。可以
*不能是纯合子替代,因此1/1不可以。
2。如果个人生病:
*可以是携带者,因此0/1不正常。
*不能有ref呼叫,0/0不正常。
*必须确保每个父母在每个潜在配对中携带一个(并且只有一个)变体。
*不打电话,./。,因为我们不能用这个方法排除这个模型,所以我们可以这样做。
是的女人有两个。这意味着女性的可以携带,但男性会受到影响,如果他们得到变异。很少有女性患上这种疾病,因为她们必须从双亲那里继承一种变体,这意味着父亲必须生病。
1.如果个人健康:
*如果女性:可以是携带者所以0/1可以
*如果男性:不能是携带者所以0/1不可以
*可以有ref呼叫或没有呼叫所以0/0和./。可以
*不能是纯合子替代,因此1/1不可以。
2。如果个人生病:
*如果女性:可以是承运人,因此0/1不正常。
*不能有ref呼叫,0/0不正常
*不呼叫,./。可以,因为我们不能以此排除模型。
x linked de novo 35 35 35 35 35 \35 35 35 \\基因型###
存储特定于个体的变体的基因型信息*筛选字符串
*ref_depth int
*alt_depth int
*具有int
*深度覆盖度的phred-likelihoods元组
*深度覆盖度int
*基因型质量浮点
*start int
*stop int
*ref string reference nucleotide
*alt string alternative sequence
*identity string dbsnp id
*var_info dict包含变量文件中所有信息的字典
*qual string基本调用分数的值
*filter string筛选状态
*基因型列出此变体的基因型列表
*基因串分号分隔字符串,具有集合基因名
*如果遵循常染色体显性模式,则为ad bool
*如果遵循常染色体显性新模式,则为ad dn bool
*如果遵循常染色体显性新模式,则为ar bool遵循常染色体隐性模式遵循常染色体隐性去新模式
*ar_comp bool如果遵循常染色体隐性复合模式
*ar_comp dn bool如果遵循常染色体隐性复合去新模式
**方法**
*get_variant(self):
stdout
*打印模型信息(self):
为每个变量打印它们遵循的继承模式。
*打印vcf变量(self):
以vcf格式打印变量到stdout
*打印原始版本(self,头列:
按原始格式打印变量。
*check_noncomplete_call(self):
检查gatk是否漏报了一些信息。
*get_genetime(self):
返回包含此变量基因型的列表。
关于个体和个体特定基因型。
**属性**
*ind字符串可以是家族中唯一的任何id
*家族字符串可以是队列中唯一的id
*母亲字符串是母亲的ind或[0,-9]如果信息缺失
*父字符串--------基因型>;}
*相位bool如果基因型信息包括此个体的相位
}
*variants dict dictionary,其中包含{<;var_id>;:<;variant>;}形式的系列中存在的所有变体