คิวเอ็ม9

  • คำอธิบาย :

QM9 ประกอบด้วยคุณสมบัติทางเรขาคณิต พลังงาน อิเล็กทรอนิกส์ และอุณหพลศาสตร์ที่คำนวณแล้วสำหรับโมเลกุลอินทรีย์ขนาดเล็กที่มีความเสถียร 134,000 โมเลกุลซึ่งประกอบด้วย C, H, O, N และ F ตามปกติ เราจะกำจัดโมเลกุลที่ไม่เคยมีมาก่อนและจัดเตรียมส่วนที่เหลืออีก 130,831 โมเลกุล

  • หน้าแรก : https://doi.org/10.6084/m9.figshare.c.978904.v5

  • ซอร์สโค้ด : tfds.datasets.qm9.Builder

  • รุ่น :

    • 1.0.0 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก
  • ขนาดดาวน์โหลด : 82.62 MiB

  • ขนาดชุดข้อมูล : 177.16 MiB

  • โครงสร้างคุณสมบัติ :

FeaturesDict({
    'A': float32,
    'B': float32,
    'C': float32,
    'Cv': float32,
    'G': float32,
    'G_atomization': float32,
    'H': float32,
    'H_atomization': float32,
    'InChI': string,
    'InChI_relaxed': string,
    'Mulliken_charges': Tensor(shape=(29,), dtype=float32),
    'SMILES': string,
    'SMILES_relaxed': string,
    'U': float32,
    'U0': float32,
    'U0_atomization': float32,
    'U_atomization': float32,
    'alpha': float32,
    'charges': Tensor(shape=(29,), dtype=int64),
    'frequencies': Tensor(shape=(None,), dtype=float32),
    'gap': float32,
    'homo': float32,
    'index': int64,
    'lumo': float32,
    'mu': float32,
    'num_atoms': int64,
    'positions': Tensor(shape=(29, 3), dtype=float32),
    'r2': float32,
    'tag': string,
    'zpve': float32,
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง ประเภทD คำอธิบาย
คุณสมบัติDict
เทนเซอร์ ลอย32
บี เทนเซอร์ ลอย32
เทนเซอร์ ลอย32
ประวัติย่อ เทนเซอร์ ลอย32
เทนเซอร์ ลอย32
G_การทำให้เป็นละออง เทนเซอร์ ลอย32
ชม เทนเซอร์ ลอย32
H_การทำให้เป็นละออง เทนเซอร์ ลอย32
อินชิ เทนเซอร์ เชือก
อินชิ_ผ่อนคลาย เทนเซอร์ เชือก
Mulliken_charges เทนเซอร์ (29,) ลอย32
ยิ้ม เทนเซอร์ เชือก
SMILES_ผ่อนคลาย เทนเซอร์ เชือก
ยู เทนเซอร์ ลอย32
U0 เทนเซอร์ ลอย32
U0_การทำให้เป็นละออง เทนเซอร์ ลอย32
U_การทำให้เป็นละออง เทนเซอร์ ลอย32
อัลฟ่า เทนเซอร์ ลอย32
ค่าธรรมเนียม เทนเซอร์ (29,) int64
ความถี่ เทนเซอร์ (ไม่มี,) ลอย32
ช่องว่าง เทนเซอร์ ลอย32
โฮโม เทนเซอร์ ลอย32
ดัชนี เทนเซอร์ int64
ลูโม เทนเซอร์ ลอย32
หมู่ เทนเซอร์ ลอย32
num_atoms เทนเซอร์ int64
ตำแหน่ง เทนเซอร์ (29, 3) ลอย32
r2 เทนเซอร์ ลอย32
แท็ก เทนเซอร์ เชือก
zpve เทนเซอร์ ลอย32
@article{ramakrishnan2014quantum,
  title={Quantum chemistry structures and properties of 134 kilo molecules},
  author={Ramakrishnan, Raghunathan and Dral, Pavlo O and Rupp, Matthias and von Lilienfeld, O Anatole},
  journal={Scientific Data},
  volume={1},
  year={2014},
  publisher={Nature Publishing Group}
}

qm9/ดั้งเดิม (การกำหนดค่าเริ่มต้น)

  • คำอธิบายการกำหนดค่า : QM9 ไม่ได้กำหนดการแยกใดๆ ดังนั้นตัวแปรนี้จึงวางชุดข้อมูล QM9 แบบเต็มไว้ในการแยกรถไฟตามลำดับเดิม (ไม่มีการสับเปลี่ยน)

  • แคชอัตโนมัติ ( เอกสารประกอบ ): เฉพาะเมื่อ shuffle_files=False (train)

  • แยก :

แยก ตัวอย่าง
'train' 130,831

qm9/นกกาน้ำ

  • คำอธิบายการกำหนดค่า : การแยกชุดข้อมูลที่ใช้โดย Cormorant รถไฟ 100,000 ขบวน การตรวจสอบ 17,748 รายการ และตัวอย่างทดสอบ 13,083 รายการ การแยกเกิดขึ้นหลังจากการสับด้วยเมล็ด 0 กระดาษ: https://arxiv.org/abs/1906.04015 แยก: https://github.com/risilab/cormorant/blob/master/src/cormorant/data/prepare/qm9.py

  • แคชอัตโนมัติ ( เอกสาร ): ใช่ (ทดสอบ การตรวจสอบ) เฉพาะเมื่อ shuffle_files=False (train)

  • แยก :

แยก ตัวอย่าง
'test' 13,083
'train' 100,000
'validation' 17,748

qm9/ไดเมนเนต

  • คำอธิบายการกำหนดค่า : การแยกชุดข้อมูลที่ใช้โดย DimeNet รถไฟ 110,000 ขบวน การตรวจสอบ 10,000 รายการ และตัวอย่างทดสอบ 10,831 รายการ การแยกเกิดขึ้นหลังจากการสับด้วยเมล็ด 42 เอกสาร: https://arxiv.org/abs/2003.03123 การแยก: https://github.com/gasteigerjo/dimenet/blob/master/dimenet/training/data_provider.py

  • แคชอัตโนมัติ ( เอกสาร ): ใช่ (ทดสอบ การตรวจสอบ) เฉพาะเมื่อ shuffle_files=False (train)

  • แยก :

แยก ตัวอย่าง
'test' 10,831
'train' 110,000
'validation' 10,000