Python中文
首页
教程
问答
标签
搜索
登录
注册
如何将包含文件名和信息的文件分别拆分为多个文件?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我有一个<code>file.txt</code>看起来像这样(为了简化我的示例,我删除了几行):</p> <pre><code>PLXNA3 ### <- filename1 Missense/nonsense : 13 mutations # <- header spaces accession codon_change amino_acid_change # <- column names tsv ID73 CAT-TAT His66Tyr # <- line tsv ID63 GAC-AAC Asp127Asn # <- line tsv ID31 GCC-GTC Ala307Val # <- line tsv NEDD4L ### <- filename2 Splicing : 1 mutation # <- header spaces accession splicing_mutation # <- column names tsv ID51 IVS1 as G-A -16229 # <- line tsv Gross deletions : 1 mutation # <- header spaces accession DNA_level description HGVS_(nucleotide) HGVS_(protein) # <- column names tsv ID853 gDNA 4.5 Mb incl. entire gene Not yet available Not yet available # <- line tsv OPHN1 ### <- filename3 Small insertions : 3 mutations # <- header spaces accession insertion HGVS_(nucleotide) # <- column names tsv ID96 TTATGTT(^183)TATtCAAATCCAGG c.549dupT p.(Gln184Serfs*23) # <- line tsv ID25 GTGCT(^310)AAGCAcaG_EI_GTCAGTTCT c.931_932dupCA # <- line tsv </code></pre> <p>我想拆分此文件以获得3个不同的文件:</p> <p><code>PLXNA3.txt</code></p> <pre><code>PLXNA3 ### <- filename1 Missense/nonsense : 13 mutations # <- header spaces accession codon_change amino_acid_change # <- column names tsv ID73 CAT-TAT His66Tyr # <- line tsv ID63 GAC-AAC Asp127Asn # <- line tsv ID31 GCC-GTC Ala307Val # <- line tsv </code></pre> <p><code>NEDD4L.txt</code></p> <pre><code>NEDD4L ### <- filename2 Splicing : 1 mutation # <- header spaces accession splicing_mutation # <- column names tsv ID51 IVS1 as G-A -16229 # <- line tsv Gross deletions : 1 mutation # <- header spaces accession DNA_level description HGVS_(nucleotide) HGVS_(protein) # <- column names tsv ID853 gDNA 4.5 Mb incl. entire gene Not yet available Not yet available # <- line tsv </code></pre> <p><code>OPHN1</code></p> <pre><code>OPHN1 ### <- filename3 Small insertions : 3 mutations # <- header spaces accession insertion HGVS_(nucleotide) # <- column names tsv ID96 TTATGTT(^183)TATtCAAATCCAGG c.549dupT p.(Gln184Serfs*23) # <- line tsv ID25 GTGCT(^310)AAGCAcaG_EI_GTCAGTTCT c.931_932dupCA # <- line tsv </code></pre> <p>如何使用诸如<code>awk</code>或<code>python</code>之类的linux命令实现所需的输出</p> <p><strong>注意:</strong></p> <ul> <li>文件名没有任何空格或制表符,但可能包含<code>-</code></李> <li>标题包含空格</李> <li>行是以制表符分隔的</李> <li>真正的分隔符应该是文件名,因为我可以有多个头</李> </ul> <p>提前谢谢</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<pre><code>awk 'NF==1{filename=$0 ".txt"};{print > filename}' file.txt </code></pre> <p>一个同等但更高傲的选择是</p> <pre><code>awk 'NF==1{f=$0".txt"}{print>f}' file.txt </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在python中从数据帧列中删除分类值?
10 回答
如何在python中从数据帧列表中删除引号
4 回答
如何在python中从数据帧创建列表
9 回答
如何在Python中从数据帧创建嵌套的JSON
9 回答
如何在Python中从数据帧显示wordcloud
3 回答
如何在Python中从数据帧的时间戳中删除字符
1 回答
如何在Python中从数据帧绘制简单绘图?
4 回答
如何在python中从数据帧行提取具有特定长度的范围?
4 回答
如何在python中从数据帧设置dict中的值
3 回答
如何在Python中从数据库中获得一个结果
5 回答
如何在python中从数据框中绘制分类条形图
8 回答
如何在Python中从数据框中选择特定细节?
8 回答
如何在python中从数据集中删除unicode
8 回答
如何在python中从数据集中删除某些数值?
10 回答
如何在python中从数据集中选择行
2 回答
如何在Python中从数组中删除元素
3 回答
如何在python中从数组中删除单个倒逗号?
5 回答
如何在python中从数组中删除对象?
4 回答
如何在python中从数组中删除引号
2 回答
如何在python中从数组中删除所有最小值
10 回答