在新的数据集Python机器学习模块中,从非数字数据训练预测字符串列

2024-09-30 20:35:19 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我的问题是: 对于现有数据集A:

host, procpath, type, segment
abc, C:\test\w.ini, mp4, movie
abc, D:\test\w.tmo, mp3, song
def, C:\test\tx.563, mp4, movie
efg, U:\test\w.ini, mp4, unknown

现在我有了一个新的数据集B:

host, filepath, type
abc, D:\test\w.ini, mp4
abc, E:\test\w.tmo, mp3
efg, C:\test\tx.563, mp4
abc, U:\test\w.ini, mp4

所有数据字段都是A&;中的字符串(非数字);B数据集显然是A&;B数据集不是这么小。数据框形状为4000x23

我想使用上述现有(A)数据集预测新(B)数据集的“段列”


Tags: 数据testhostsongtypesegmentmoviemp3