我需要找出每列中的字母数,如下所示:
String: ATCG
TGCA
AAGC
GCAT
字符串是一个系列。你知道吗
我需要编写一个程序来获得以下内容:
0 1 2 3
A 2 1 1 1
T 1 1 0 1
C 0 1 2 1
G 1 1 1 1
我已经写了下面的代码,但是我得到了0索引中的一行和末尾的一列(列索引450,实际列编号451),带有nan值。我不应该得到行或列451。我只需要450列。你知道吗
f = zip(*string)
counts = [{letter: column.count(letter) for letter in column} for column in
f]
counts=pd.DataFrame(counts).transpose()
print(counts)
counts = counts.drop(counts.columns[[450]], axis =1)
有人能帮我理解这个问题吗?你知道吗
使用
Series.value_counts()
:我不确定您希望对索引排序的逻辑性,但是您可以对这个结果调用
.reindex()
或.sort_index()
。你知道吗第一行
s.str.join('|').str.split('|', expand=True)
为您提供一个“扩展”版本这应该比在每一行上调用
pd.Series(list(x)) ...
更快。你知道吗这里有一种方法可以实现你的逻辑。如果需要,可以通过
lst = s.tolist()
将序列转换为列表。你知道吗结果
解释
pd.DataFrame
。你知道吗相关问题 更多 >
编程相关推荐