TCR全谱数据分析的TCRDist优化计算
fast-tcrdist的Python项目详细描述
快速计数器
fast_tcrdist是Dash等人发表的tcrdist算法的优化版本。Nature(2017):doi:10.1038/nature22383在
为了增强TCRDist的原始实现,fast-TCRDist使用了neederman-Wunsch对齐算法来对齐TCR序列 并通过cython创建TCRDist矩阵。为了与其他常见的单细胞分析工具很好地集成,fast\tcrdist利用 用于存储TCRDist矩阵和相关元数据的Anndata数据结构。目前,这已经在TCR/基因表达上进行了测试 从Cellranger(https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/what-is-cell-ranger)输出,但是 未来的版本将致力于允许其他文件格式。在
除了运行TCRDist算法外,fast\u TCRDist还允许您将单个细胞基因表达的TCR信息聚合到一个 允许集成下游分析的anndata对象。在
外部文件
用于对齐的BLOSUM62矩阵来自NCBI:https://www.ncbi.nlm.nih.gov/IEB/ToolBox/C_DOC/lxr/source/data/BLOSUM62
CDR氨基酸信息来自TCRDist数据库文件“alphabeta”_数据库tsv“(https://www.dropbox.com/s/kivfp27gbz2m2st/tcrdist_extras_v2.tgz) 并将其重新格式化为.json格式(mouse\u CDRs_用于_10X.json,human_CDRs_用于_10X.json)
- 项目
标签: