Python中文
首页
教程
问答
标签
搜索
登录
注册
如何比较群集 2.0
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我之前问了一个类似的问题,但是我的输入文件很难处理,所以我再次问这个问题(希望这些文件能更容易处理!)我正在尝试使用python,因为我现在正试图学习它!(或者可能直接在航站楼里?!)在</p> <p>使用一组9701个细菌名称的数据集,我使用两个不同的程序对它们进行聚类。这些程序的输出(经过一些操作后)产生了两个文本文件,每个程序对应一个,如下所示:</p> <p><code>0 Pyrobaculum aerophilum Thermoproteaceae<br/> 1 Mycobacterium aichiense Mycobacteriaceae<br/> 1 Mycobacterium alvei Mycobacteriaceae<br/> 1 Mycobacterium aromaticivorans Mycobacteriaceae<br/> 1 Mycobacterium aubagnense Mycobacteriaceae<br/> 1 Mycobacterium boenickei Mycobacteriaceae<br/> 1 Mycobacterium brisbanense Mycobacteriaceae</code></p> <p>编号对应于细菌所在的集群,后跟细菌的实际名称(因此,上面的簇“0”中有一个细菌,簇“1”中有6个细菌)。在</p> <p><strong>我的问题:</strong>我想比较两个文件的输出,看看它们对细菌的分类是否/如何不同。理想情况下,我会生成一个包含这些差异的新文件。在同一个簇中,细菌可能是两个不同的簇。就我而言,如果同一个细菌在一起,但是簇号发生变化,两个簇之间的文本文件:那就不重要了。但是,如果有一个程序把10个布鲁氏菌放在“10”簇中,而只有9个在“2321”簇中——我想知道!)在</p> <p>那么,是否可以比较这两个文本文件,这样就不会看到实际的簇号,而是内容是否保持不变?在</p> <p>注意:如果我的两个群集文件更易于使用,则可以很容易地将两个群集文件更改为以下格式:</p> <p><code>Brucella pinnipedialis Brucellaceae 0<br/> Brucella suis Brucellaceae 0<br/> Brucella ceti Brucellaceae 0</code></p> <p>或者以其他方式?在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>假设每个细菌只在一个集群中,您可以用它包含的第一个细菌(按字母顺序)重命名每个集群。相同的簇将具有相同的名称,因此可以直接进行比较。在</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
文本导入时标题行中的特殊字符
2 回答
文本小部件:在没有输入时更新并在循环后保持空闲
4 回答
文本小部件tkin
5 回答
文本小部件tkinter中的标签更改或文本外观更改是否有撤消功能?
8 回答
文本小部件tkinter复制图像选项
3 回答
文本小部件上的Python Tkinter ttk滚动条未缩放
10 回答
文本小部件上的滚动条可能需要根据制表符ord显示前进行滚动
3 回答
文本小部件不显示lis中的内容
10 回答
文本小部件不显示Unicode字符
9 回答
文本小部件中写入的行间距
9 回答
文本小部件中的文本作为变量
3 回答
文本小部件中的滚动条仅显示在底部
5 回答
文本小部件中的选项卡键空间计数
1 回答
文本小部件作为Lis
7 回答
文本小部件在主框架中扩展列宽
2 回答
文本小部件未使用删除功能清除
7 回答
文本小部件滚动动画(Tkinter、Python)
2 回答
文本居中。格式正确吗?
3 回答
文本差分算法
6 回答
文本已知时音频文件中的单词索引
7 回答