Python中文
首页
教程
问答
标签
搜索
登录
注册
使用awk比较和打印两个文件的输出
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>是否可以使用awk比较和返回两个匹配文件的结果?</p> <p>我目前正在使用:</p> <pre><code>awk 'BEGIN{FS=OFS="\t"} NR==FNR{c[$1$2]++;next};c{$1$2}>0' queryfile hitsfile </code></pre> <p>要匹配查询结果并以命中返回输出,但是它只返回来自hits文件的列</p> <p>我试过:</p> ^{pr2}$ <p>但它不起作用</p> <p>我的示例数据如下所示:</p> <p><em>queryfile</em></p> ^{pr3}$ <p><em>hitsfile</em></p> ^{pr4}$ <p>我希望输出文件如下所示</p> <pre><code>*output results* chr1 1000 1005 0.5 BDSD chr1 1010 1015 0.4 SKK1 chr2 1015 1015 0.1 AVPR </code></pre> <p>因此,基本上,返回与查询匹配的命中数,并在查询数据中返回另一列。这是否可以使用awk ONEARNER?</p> <p>另外,另一个问题是,在查询文件中给定查询范围,并返回hitsfile中的所有行,与与awk的精确匹配是否可能?</p> <p>通常我用R来完成这些,但处理大型文件和awk时速度慢得多!</p> <p>谢谢!</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<pre><code>$ awk 'NR==FNR{a[$1,$2]=$4;next} ($1,$2) in a{print $0, a[$1,$2]}' queryfile hitsfile chr1 1000 1005 0.5 BDSD chr1 1010 1015 0.4 SKK1 chr2 1015 1015 0.1 AVPR </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何为此数据帧创建散点图?
7 回答
如何为此编写Django模板
3 回答
如何为此表达式编写正则表达式?
6 回答
如何为步进电机选择合适的值?
6 回答
如何为每15分钟间隔的日期时间行(在新列中)添加标签?
5 回答
如何为每一列创建汇总表?
3 回答
如何为每一组groupbyPandas做滚动“得到假人”
10 回答
如何为每一行分别运行函数(python)?
8 回答
如何为每一行生成一个随机数?
9 回答
如何为每一轮将pytorch模型输出存储到numpy
10 回答
如何为每个.py-fi文件创建单独的zip文件
1 回答
如何为每个<li class=”“><a>找到最近的上述同级<li>?
10 回答
如何为每个CSV列生成特定的文件?
3 回答
如何为每个csv文件使用read_csv,即使它是空的?PythonPandas
10 回答
如何为每个CSV文件创建单独的Pandas数据帧并给它们起有意义的名称?
7 回答
如何为每个datetime和每个id创建一行?
8 回答
如何为每个Django型号选择赋予不同的颜色
6 回答
如何为每个Django模型实例安排一个周期性的芹菜任务?
7 回答
如何为每个Django视图设置一个装饰器?
5 回答
如何为每个for循环迭代分配变量
2 回答