用同一循环中的列表填充dict

mylist = ['A', 'C', 'G','T'] dict = {key: None for key in mylist} for i,(a,b) in enumerate(zip_longest(jkl[1],dict.keys())): t=str(list(jkl.str[i])) single_occurrences = Counter(t) kl.append(single_occurrences.get(b)) dict[b]=kl

3条回答

网友

1楼 · 编辑于 2024-09-27 02:17:10

`Counter`

from collections import Counter

pd.Series(Counter(
    (c, i) for i, C in enumerate(zip(*jkl)) for c in C)
).unstack(fill_value=0)

   0  1  2  3
A  1  1  0  1
C  1  0  1  1
G  1  0  1  1
T  0  2  1  0

pd.Series(Counter(
    (c, i) for i, C in enumerate(zip(*jkl)) for c in C
)).unstack(fill_value=0).T.to_dict('l')

{'A': [1, 1, 0, 1], 'C': [1, 0, 1, 1], 'G': [1, 0, 1, 1], 'T': [0, 2, 1, 0]}

`np.add.at`

完全不同的策略

r, i = np.unique([*''.join(jkl)], return_inverse=True)
n, m = len(r), len(jkl)
j = np.tile(np.arange(n), m)
a = np.zeros((n, n), int)
np.add.at(a, (i, j), 1)

`DataFrame`

pd.DataFrame(a, r)

   0  1  2  3
A  1  1  0  1
C  1  0  1  1
G  1  0  1  1
T  0  2  1  0

`Dictionary`

dict(zip(r, a.tolist()))

{'A': [1, 1, 0, 1], 'C': [1, 0, 1, 1], 'G': [1, 0, 1, 1], 'T': [0, 2, 1, 0]}

网友

2楼 · 编辑于 2024-09-27 02:17:10

我们可以对熊猫进行切片和计数，然后每次构造一个计数字典，如：

max_len = jkl.str.len().max()
counts = [jkl.str[i].value_counts() for i in range(max_len)]
df = pd.DataFrame(counts, columns=['A', 'C', 'G', 'T'])

这给了我们一个数据帧：

>>> df
     A    C    G    T
0  1.0  1.0  1.0  NaN
1  1.0  NaN  NaN  2.0
2  NaN  1.0  1.0  1.0
3  1.0  1.0  1.0  NaN

然后我们可以用零填充NaN，并将数据转换成int：

>>> df.fillna(0).astype(int)
   A  C  G  T
0  1  1  1  0
1  1  0  0  2
2  0  1  1  1
3  1  1  1  0

最后，我们可以将此数据帧转换为列表字典：

>>> df.fillna(0).astype(int).to_dict('list')
{'A': [1, 1, 0, 1], 'C': [1, 0, 1, 1], 'G': [1, 0, 1, 1], 'T': [0, 2, 1, 0]}

网友

3楼 · 编辑于 2024-09-27 02:17:10

在重新创建数据帧之后使用crosstab

S=pd.DataFrame(s.map(list).tolist()).melt()
pd.crosstab(S.value,S.variable)
Out[338]: 
variable  0  1  2  3
value               
A         1  1  0  1
C         1  0  1  1
G         1  0  1  1
T         0  2  1  0

添加to_dict后

pd.crosstab(S.value,S.variable).T.to_dict('l')
Out[342]: {'A': [1, 1, 0, 1], 'C': [1, 0, 1, 1], 'G': [1, 0, 1, 1], 'T': [0, 2, 1, 0]}

`Counter`

`np.add.at`

`DataFrame`

`Dictionary`

相关问题更多 >

编程相关推荐

热门问题

热门文章

用同一循环中的列表填充dict

Counter

np.add.at

DataFrame

Dictionary

相关问题 更多 >

编程相关推荐

热门问题

热门文章

`Counter`

`np.add.at`

`DataFrame`

`Dictionary`

相关问题更多 >