qm9

  • Description :

QM9 comprend les propriétés géométriques, énergétiques, électroniques et thermodynamiques calculées pour 134 000 petites molécules organiques stables composées de C, H, O, N et F. Comme d'habitude, nous supprimons les molécules non caractérisées et fournissons les 130 831 restantes.

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})
  • Documentation des fonctionnalités :
Fonctionnalité Classe Forme Type D Description
FonctionnalitésDict
UN Tenseur flotteur32
B Tenseur flotteur32
C Tenseur flotteur32
CV Tenseur flotteur32
g Tenseur flotteur32
G_atomisation Tenseur flotteur32
H Tenseur flotteur32
H_atomisation Tenseur flotteur32
InChI Tenseur chaîne
InChI_relaxé Tenseur chaîne
Mulliken_charges Tenseur (29,) flotteur32
SOURIRES Tenseur chaîne
SMILES_détendu Tenseur chaîne
U Tenseur flotteur32
U0 Tenseur flotteur32
U0_atomisation Tenseur flotteur32
U_atomisation Tenseur flotteur32
alpha Tenseur flotteur32
des charges Tenseur (29,) int64
fréquences Tenseur (Aucun,) flotteur32
écart Tenseur flotteur32
homo Tenseur flotteur32
indice Tenseur int64
lumo Tenseur flotteur32
mu Tenseur flotteur32
num_atomes Tenseur int64
postes Tenseur (29, 3) flotteur32
r2 Tenseur flotteur32
étiqueter Tenseur chaîne
zpve Tenseur flotteur32
@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/original (configuration par défaut)

  • Description de la config : QM9 ne définit aucun split. Ainsi, cette variante place l'ensemble de données QM9 complet dans la répartition du train, dans l'ordre d'origine (pas de brassage).

  • Mise en cache automatique ( documentation ) : uniquement lorsque shuffle_files=False (train)

  • Divisions :

Diviser Exemples
'train' 130 831

qm9/cormoran

Diviser Exemples
'test' 13 083
'train' 100 000
'validation' 17 748

qm9/dimenet

Diviser Exemples
'test' 10 831
'train' 110 000
'validation' 10 000