tsv文件和基于源文件的列重命名之间的完全联接

1条回答

网友

1楼 · 发布于 2024-09-21 10:31:34

让我知道如果这个代码对你有效，没有这些文件很难测试

import re
import os
import sys
import pandas as pd

tpm_dict = {}

for fn in os.listdir(sys.argv[1]):
    if re.match('.*\.tsv$', fn):
        header = fn.replace('.tsv', '')
        this_df = pd.read_csv(os.path.join(sys.argv[1], fn), sep='\t')
        for i, row in this_df.iterrows():
            try:
                tpm_dict[row['target_id']][header] = row['tpm']
            except KeyError:
                try:
                    tpm_dict[row['target_id']] = {header: row['tpm']}
                except:
                    print(f"Problem in {fn} at row {i}")

df = pd.DataFrame.from_dict(tpm_dict, orient='index')
df.to_csv('joined.tsv', sep='\t')

另存为tsvjoin.py，然后运行python3 tsvjoin.py <folder with TSVs>

编辑：打字错误

编程相关推荐

java如何从地图的元素创建对象
如何在java中调整数组大小？
随机方法的java问题
java如何修复mavenpackaged jar报告的错误：无法找到或加载主类。\公式1。0快照。罐子
java使用字符串生成公钥和私钥
java在字段之前使用@XmlElement与在getter声明之前使用@XmlElement有什么区别？
java Spring引导将JAXWS webservice注册为bean
java如何创建动态列表<String>
java我如何让这个纸牌游戏的“动作”持续执行直到找到赢家？
java spring云：假装无法与领事合作

相关问题更多 >

编程相关推荐

热门问题

热门文章

tsv文件和基于源文件的列重命名之间的完全联接

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >