analyse

  • Description:

Tâches SCAN avec différentes divisions.

SCAN est un ensemble de tâches de navigation simples basées sur le langage pour étudier l'apprentissage de la composition et la généralisation à zéro.

La plupart des divisions sont décrites à https://github.com/brendenlake/SCAN Pour le grand écart MCD Veuillez vous reporter à https://arxiv.org/abs/1912.09713.pdf

Utilisation de base :

data = tfds.load('scan/length')

Exemple plus avancé :

data = tfds.load(
    'scan',
    builder_kwargs=dict(
        config=tfds.text.ScanConfig(
            name='simple_p8', directory='simple_split/size_variations')))
FeaturesDict({
    'actions': Text(shape=(), dtype=tf.string),
    'commands': Text(shape=(), dtype=tf.string),
})
@inproceedings{Lake2018GeneralizationWS,
  title={Generalization without Systematicity: On the Compositional Skills of
         Sequence-to-Sequence Recurrent Networks},
  author={Brenden M. Lake and Marco Baroni},
  booktitle={ICML},
  year={2018},
  url={https://arxiv.org/pdf/1711.00350.pdf},
}
@inproceedings{Keysers2020,
  title={Measuring Compositional Generalization: A Comprehensive Method on
         Realistic Data},
  author={Daniel Keysers and Nathanael Sch"{a}rli and Nathan Scales and
          Hylke Buisman and Daniel Furrer and Sergii Kashubin and
          Nikola Momchev and Danila Sinopalnikov and Lukasz Stafiniak and
          Tibor Tihon and Dmitry Tsarkov and Xiao Wang and Marc van Zee and
          Olivier Bousquet},
  note={Additional citation for MCD splits},
  booktitle={ICLR},
  year={2020},
  url={https://arxiv.org/abs/1912.09713.pdf},
}

scan/simple (configuration par défaut)

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.47 MiB

  • scissions:

Diviser Exemples
'test' 4 182
'train' 16 728

scan/addprim_jump

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.53 MiB

  • scissions:

Diviser Exemples
'test' 7 706
'train' 14 670

scan/addprim_turn_left

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.58 MiB

  • scissions:

Diviser Exemples
'test' 1 208
'train' 21 890

scan/remplissage_num0

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 3.20 MiB

  • scissions:

Diviser Exemples
'test' 1 173
'train' 15 225

scan/remplissage_num1

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 3.51 MiB

  • scissions:

Diviser Exemples
'test' 1 173
'train' 16 290

scan/remplissage_num2

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 3.84 MiB

  • scissions:

Diviser Exemples
'test' 1 173
'train' 17 391

scan/remplissage_num3

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.17 MiB

  • scissions:

Diviser Exemples
'test' 1 173
'train' 18 528

balayage/longueur

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.47 MiB

  • scissions:

Diviser Exemples
'test' 3 920
'train' 16 990

scan/template_around_right

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.17 MiB

  • scissions:

Diviser Exemples
'test' 4 476
'train' 15 225

scan/template_jump_around_right

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.17 MiB

  • scissions:

Diviser Exemples
'test' 1 173
'train' 18 528

scan/template_opposite_right

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.22 MiB

  • scissions:

Diviser Exemples
'test' 4 476
'train' 15 225

scan/modèle_droit

  • Taille du téléchargement: 17.82 MiB

  • Dataset Taille: 4.26 MiB

  • scissions:

Diviser Exemples
'test' 4 476
'train' 15 225

scan/mcd1

  • Taille du téléchargement: 17.89 MiB

  • Dataset Taille: 1.89 MiB

  • scissions:

Diviser Exemples
'test' 1 045
'train' 8 365

scan/mcd2

  • Taille du téléchargement: 17.89 MiB

  • Dataset Taille: 1.84 MiB

  • scissions:

Diviser Exemples
'test' 1 045
'train' 8 365

scan/mcd3

  • Taille du téléchargement: 17.89 MiB

  • Dataset Taille: 1.87 MiB

  • scissions:

Diviser Exemples
'test' 1 045
'train' 8 365