ATIS(航空旅行信息系统)数据的结构是什么

2024-06-15 05:03:33 发布

您现在位置:Python中文网/ 问答频道 /正文

当我使用ATIS(航空旅行信息系统)数据集(http://lisaweb.iro.umontreal.ca/transfert/lisa/users/mesnilgr/atis/)对递归神经网络进行研究时。我对它的结构感到困惑。在

例如,在使用data = pickle.load(open("./dataset/atis.fold0.pkl", "rb"),encoding='iso-8859-1')加载atis.fold0.pkl,我使用print (np.shape(data_train))来获得(4,)。我认为数据[0]是训练集,数据[1]是有效集,数据[2]是测试集,数据[3]是dict

但是当我使用print(np.shape(data[0]))时,我得到(3, 3983)。我想知道为什么我在里面放了3排?这三排有什么区别。在

文件之间有什么区别atis.fold0.pkl码,atis.fold1.pkl码,atis.fold2.pkl码,atis.折叠3.pkl码,atis.折叠4.pkl?在


Tags: 数据http航空datanpprintpklshape
1条回答
网友
1楼 · 发布于 2024-06-15 05:03:33
f = gzip.open(filename, 'rb')
try:
    train_set, valid_set, test_set, dicts = pickle.load(f, encoding='latin1')
except:
    train_set, valid_set, test_set, dicts = pickle.load(f)


print np.shape(train_set)

每一个pickle都可以分为培训、验证、测试和它的字典。当您看到dictionary元素时,它们包含
单词2idx
表2IDX
标签2idx

现在测试以下代码 for i in train_set: print len(i[0])

它将返回相同长度的文件。 所以第一个元素是文字。第二是表2idx,第三个是槽填充的最终结果(标签2idx)

用这句话来谴责那些ID,你就会明白它的意思了。在

相关问题 更多 >