kardiyotoks

  • Açıklama :

İlaç Kardiyotoksisite veri seti [1-2], kalp atım ritmi ile ilişkili bir protein olan hERG hedefine bağlanmanın neden olduğu kardiyotoksisiteyi tespit etmeye yönelik bir molekül sınıflandırma görevidir. Veriler, hERG aktivitesine sahip 9000'den fazla molekülü kapsar.

  1. Veriler dört bölüme ayrılır: train, test-iid, test-ood1, test-ood2.

  2. Veri kümesindeki her molekül, grafik sinir ağı modellemesini kolaylaştırmak için tasarlanmış 2B grafik açıklamalarına sahiptir. Düğümler molekülün atomlarıdır ve kenarlar bağlardır. Her atom, atom tipi gibi temel atom bilgilerini kodlayan bir vektör olarak temsil edilir. Benzer mantık tahviller için de geçerlidir.

  3. Grafik alanındaki dağılım kayması üzerine araştırmayı kolaylaştırmak için test setlerindeki her molekül için Tanimoto parmak izi mesafesini (eğitim verilerine) dahil ediyoruz.

Her örnek için özellikler şunları içerir: atomlar: düğüm özelliklerini depolayan şekle (60, 27) sahip bir 2D tensör. 60'tan az atoma sahip moleküller sıfırlarla doldurulur. Her atomun 27 atom özelliği vardır. çiftler: kenar özelliklerini saklayan şekle (60, 60, 12) sahip bir 3D tensör. Her kenar 12 kenar özelliğine sahiptir. atom_mask: düğüm maskelerini saklayan (60, ) şeklinde bir 1D tensör. 1 karşılık gelen atomun gerçek olduğunu, aksi takdirde dolgulu olduğunu gösterir. pair_mask: kenar maskelerini saklayan şekle (60, 60) sahip bir 2D tensör. 1 karşılık gelen kenarın gerçek olduğunu, aksi takdirde dolgulu olduğunu gösterir. aktif: molekülün toksik olup olmadığını gösteren tek-sıcak bir vektör. [0, 1] toksik olduğunu, aksi takdirde [1, 0] toksik olmadığını gösterir.

Referanslar

[1]: VB Siramshetty ve ark. Büyük Veri Çağında hERG Kanal Engellemesinin Öngörülmesi için Yapay Zeka Yöntemlerinin Kritik Değerlendirmesi. JCIM, 2020. https://pubs.acs.org/doi/10.1021/acs.jcim.0c00884

[2]: K. Han ve ark. Dağıtım Değişimi Altında İlaç Keşfi için Güvenilir Grafik Sinir Ağları. NeurIPS DistShift Workshop 2021. https://arxiv.org/abs/2111.12951

Bölmek Örnekler
'test' 839
'test2' 177
'train' 6.523
'validation' 1.631
  • Özellikler :
FeaturesDict({
    'active': Tensor(shape=(2,), dtype=tf.int64),
    'atom_mask': Tensor(shape=(60,), dtype=tf.float32),
    'atoms': Tensor(shape=(60, 27), dtype=tf.float32),
    'dist2topk_nbs': Tensor(shape=(1,), dtype=tf.float32),
    'molecule_id': tf.string,
    'pair_mask': Tensor(shape=(60, 60), dtype=tf.float32),
    'pairs': Tensor(shape=(60, 60, 12), dtype=tf.float32),
})
  • alıntı :
@ARTICLE{Han2021-tu,
  title         = "Reliable Graph Neural Networks for Drug Discovery Under
                   Distributional Shift",
  author        = "Han, Kehang and Lakshminarayanan, Balaji and Liu, Jeremiah",
  month         =  nov,
  year          =  2021,
  archivePrefix = "arXiv",
  primaryClass  = "cs.LG",
  eprint        = "2111.12951"
}