一个垃圾箱到基因转换包。
BinToGene的Python项目详细描述
二聚体
将一个由bin矩阵转换成基因的细胞的库。 这可能是有用的,例如,当一个人希望使用现有的基因表达 按bin矩阵将工具转换为sc ATAC seq cell。该包使用gencode文件(v34)来确定起始位置和结束位置 蛋白质编码基因。然后,这个间隔被固定或基因长度延长 依赖值以获得新的间隔I=(start-v1,end+v2)。然后把箱子放进去 搜索所提供的数据矩阵,看它们是否相交 二进制搜索实现用于确定 找到这样的交叉点。然后将存储箱的值相加或 用户指定的平均值。结果向量是的计数向量 考虑中的基因。注意,这里的计数不代表表达式 但在sc-ATAC-seq的情况下,染色质的可及性很重要。 这些基因以矩阵的形式堆叠在一起。 用于分析基因表达数据的工具可用于 通过这种方式形成的基因矩阵分析细胞。在
示例
importnumpyasnpx=np.random.randint(0,2,(200,4000))# your cell by bin matrixbin_names=['chr1:0-1000','chr1:1001-2000',...]# your list of bin namesbtg=BinToGene()# Use default interval extension parameterscounts,ids=btg.convert(x,bin_names,prefix='chr',delim1=':',delim2='-')
在运行一些基本的预处理后,通过UMAP获得的细胞基因矩阵的示例
- 项目
标签: