Deepchem磁盘数据到numpy阵列

from __future__ import division from __future__ import print_function from __future__ import unicode_literals import numpy as np import tensorflow as tf import deepchem as dc from deepchem.models.tensorgraph.models.graph_models import GraphConvModel

graph_featurizer = dc.feat.graph_features.ConvMolFeaturizer() loader_train = dc.data.data_loader.CSVLoader( tasks=['Activity'], smiles_field="smiles",featurizer=graph_featurizer) dataset_train = loader_train.featurize( './train_smiles_data.csv')

dataset_train.X array([<deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc3ad748>, <deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc367828>, <deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc367208>, <deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc369c50>], dtype=object) dataset_train.y array([[2.71], [4.41], [3.77], [4.2 ]]) for x, y, w, id in dataset_train.itersamples(): print(x, y, w, id) <deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc3ad6a0> [2.71] [1.] CC1=C(O)C=CC=C1 <deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc30f518> [4.41] [1.] [O-][N+](=O)C1=CC=C(Br)S1 <deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc30f748> [3.77] [1.] CCC/C=C/C=O <deepchem.feat.mol_graphs.ConvMol object at 0x7f8bfc30f940> [4.2] [1.] CCCCCC1=CC=CS1

1条回答

网友

1楼 · 发布于 2024-06-28 15:28:47

根据previous question数据集，train.X是ConvMol对象的数组。这些ConvMol对象是每个输入分子特征的容器。这些特征的表示方式与目标“train\u dataset.y”不同，因为它们是更复杂的图形特征。再次查看ConvMol对象的source code，并查看convmolfeatureizer的source code。然后可以确定如何解释这些特征：

# Inspect features for molecule 0
conv_feature = dataset_train.X[0]
# Print the atom features
print(conv_feature.get_atom_features())
# Print the adjacency list
print(conv_feature.get_adjancency_list())

相关问题更多 >

编程相关推荐

热门问题

热门文章