Pandas：数据帧到矩阵

2条回答

网友

1楼 · 编辑于 2024-10-03 13:17:20

这是你想要的吗？在

df.pivot(*df.columns)
Out[648]: 
song_id  SOBYHAJ12A6701BF1D  SODACBL12A8C13C273  SODXRTY12AB0180F3B  \
user_id                                                               
frank                  23.0                 NaN                 NaN   
john                    NaN                 1.0                 3.0   
mary                    NaN                 NaN                 NaN   
song_id  SOFRQTD12A81C233C0  
user_id                      
frank                   NaN  
john                    NaN  
mary                    1.0

网友

2楼 · 编辑于 2024-10-03 13:17:20

可以使用^{}将user_id和{}字段编码为整数。这些可以作为矩阵的索引。从那里我将使用您从^{}中选择的矩阵来加载数据。如下所示：

from sklearn.preprocessing import LabelEncoder
from scipy import sparse as ss

le = LabelEncoder()
user_ids = le.fit_transform(df.user_id)
song_ids = le.fit_transform(df.song_id)

sarr = ss.csr_matrix((df.playcount, (user_ids, song_ids)))
sarr
<3x4 sparse matrix of type '<class 'numpy.int64'>'
    with 4 stored elements in Compressed Sparse Row format>
sarr.todense()
matrix([[23,  0,  0,  0],
        [ 0,  1,  3,  0],
        [ 0,  0,  0,  1]], dtype=int64)

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：数据帧到矩阵

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >