Snakemake:不存在的通配符出错

import pandas as pd shell.executable("bash") configfile: "config.yaml" # open samplesheet units = pd.read_table(config["units"], dtype=str) units = units.set_index(["sample", "unit"]) rule all: input: expand("{sample}/{sample}_{unit}_merge_R1.txt", sample=units.index.get_level_values('sample').unique(), unit=units.index.get_level_values('unit').unique()), expand("{sample}/{sample}_{unit}_merge_R2.txt", sample=units.index.get_level_values('sample').unique(), unit=units.index.get_level_values('unit').unique()) def get_fastq_r1(wildcards): return units.loc[(wildcards.sample, wildcards.unit), ["fq1"]].dropna().values.flatten() def get_fastq_r2(wildcards): return units.loc[(wildcards.sample, wildcards.unit), ["fq2"]].dropna().values.flatten() rule merge: input: r1 = get_fastq_r1, r2 = get_fastq_r2 output: "{sample}/{sample}_{unit}_merge_R1.txt", "{sample}/{sample}_{unit}_merge_R2.txt" shell: """ echo {input.r1} > {sample}/{sample}_{unit}_merge_R1.txt echo {input.r2} > {sample}/{sample}_{unit}_merge_R2.txt """

import pandas as pd shell.executable("bash") configfile: "config.yaml" ### from itertools import product def filter_combinator(combinator, inlist): def filtered_combinator(*args, **kwargs): for wc_comb in combinator(*args, **kwargs): # Use frozenset instead of tuple # in order to accomodate # unpredictable wildcard order if frozenset(wc_comb) in inlist: yield wc_comb return filtered_combinator # open samplesheet units = pd.read_table(config["units"], dtype=str) # list of pair sample-unit included in the samplesheet inList={ frozenset({("sample", "A"), ("unit", "lane1")}), frozenset({("sample", "A"), ("unit", "lane2")}), frozenset({("sample", "B"), ("unit", "lane1")})} # set df index units = units.set_index(["sample", "unit"]) # build new iterator filtered_product = filter_combinator(product, inList) rule all: input: expand("{sample}/{sample}_{unit}_merge_R1.txt", filtered_product, sample=units.index.get_level_values('sample').unique().values, unit=units.index.get_level_values('unit').unique().values), expand("{sample}/{sample}_{unit}_merge_R2.txt", filtered_product, sample=units.index.get_level_values('sample').unique().values, unit=units.index.get_level_values('unit').unique().values) def get_fastq_r1(wildcards): return units.loc[(wildcards.sample, wildcards.unit), ["fq1"]].dropna().values.flatten() def get_fastq_r2(wildcards): return units.loc[(wildcards.sample, wildcards.unit), ["fq2"]].dropna().values.flatten() rule merge: input: r1 = get_fastq_r1, r2 = get_fastq_r2 output: "{sample}/{sample}_{unit}_merge_R1.txt", "{sample}/{sample}_{unit}_merge_R2.txt" message: "test" shell: """ cat {input.r1} > {sample}/{sample}_{unit}_merge_R1.txt cat {input.r2} > {sample}/{sample}_{unit}_merge_R2.txt """

Job 1: test RuleException in line 53 of /home/nrosewick/Documents/analysis/pilot_data_ADX17009/workflow/test_snakemake/Snakefile: NameError: The name 'sample' is unknown in this context. Please make sure that you defined that variable. Also note that braces not used for variable access have to be escaped by repeating them, i.e. {{print $1}}

1条回答

网友

1楼 · 发布于 2024-10-02 12:29:02

以下是我基于https://stackoverflow.com/a/41185568/1025741找到的解决方案：

import pandas as pd
shell.executable("bash")

configfile: "config.yaml"

### 
from itertools import product

def filter_combinator(combinator, inlist):
    def filtered_combinator(*args, **kwargs):
        for wc_comb in combinator(*args, **kwargs):
            # Use frozenset instead of tuple
            # in order to accomodate
            # unpredictable wildcard order
            if frozenset(wc_comb) in inlist:
                yield wc_comb
    return filtered_combinator

# open samplesheet
units = pd.read_table(config["units"], dtype=str)

# list of pair sample-unit
#inList=units[["sample","unit"]].drop_duplicates().to_dict('r')
inList={
    frozenset({("sample", "A"), ("unit", "lane1")}),
    frozenset({("sample", "A"), ("unit", "lane2")}),
    frozenset({("sample", "B"), ("unit", "lane1")})}

# set df index
units=units.set_index(["sample","unit"])

# build new iterator
filtered_product = filter_combinator(product, inList)

rule all:
    input:
        expand("{sample}/{sample}_{unit}_merge_R1.txt",
            filtered_product,
            sample=units.index.get_level_values('sample').unique().values,
            unit=units.index.get_level_values('unit').unique().values),
        expand("{sample}/{sample}_{unit}_merge_R2.txt",
            filtered_product,
            sample=units.index.get_level_values('sample').unique().values,
            unit=units.index.get_level_values('unit').unique().values)


def get_fastq_r1(wildcards):
    return units.loc[(wildcards.sample, wildcards.unit), ["fq1"]].dropna().values.flatten()

def get_fastq_r2(wildcards):
    return units.loc[(wildcards.sample, wildcards.unit), ["fq2"]].dropna().values.flatten()

rule merge:
    input:
        r1=get_fastq_r1,
        r2=get_fastq_r2
    output:
        r1_o="{sample}/{sample}_{unit}_merge_R1.txt",
        r2_o="{sample}/{sample}_{unit}_merge_R2.txt"
    message:
        "test"
    shell:
        """
        cat {input.r1} > {output.r1_o}
        cat {input.r2} > {output.r2_o}
        """

相关问题更多 >

编程相关推荐

热门问题

热门文章