escanear

  • Descripción :

SCAN tareas con varias divisiones.

SCAN es un conjunto de tareas de navegación sencillas basadas en el lenguaje para estudiar el aprendizaje compositivo y la generalización de tiro cero.

La mayoría de las divisiones se describen en https://github.com/brendenlake/SCAN Para las divisiones de MCD, consulte https://arxiv.org/abs/1912.09713.pdf

Uso básico:

data = tfds.load('scan/length')

Ejemplo más avanzado:

data = tfds.load(
    'scan',
    builder_kwargs=dict(
        config=tfds.text.ScanConfig(
            name='simple_p8', directory='simple_split/size_variations')))
FeaturesDict({
    'actions': Text(shape=(), dtype=tf.string),
    'commands': Text(shape=(), dtype=tf.string),
})
  • Documentación de características :
Rasgo Clase Forma Tipo D Descripción
CaracterísticasDict
comportamiento Texto tf.cadena
comandos Texto tf.cadena
@inproceedings{Lake2018GeneralizationWS,
  title={Generalization without Systematicity: On the Compositional Skills of
         Sequence-to-Sequence Recurrent Networks},
  author={Brenden M. Lake and Marco Baroni},
  booktitle={ICML},
  year={2018},
  url={https://arxiv.org/pdf/1711.00350.pdf},
}
@inproceedings{Keysers2020,
  title={Measuring Compositional Generalization: A Comprehensive Method on
         Realistic Data},
  author={Daniel Keysers and Nathanael Sch"{a}rli and Nathan Scales and
          Hylke Buisman and Daniel Furrer and Sergii Kashubin and
          Nikola Momchev and Danila Sinopalnikov and Lukasz Stafiniak and
          Tibor Tihon and Dmitry Tsarkov and Xiao Wang and Marc van Zee and
          Olivier Bousquet},
  note={Additional citation for MCD splits},
  booktitle={ICLR},
  year={2020},
  url={https://arxiv.org/abs/1912.09713.pdf},
}

escaneo/simple (configuración predeterminada)

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.47 MiB

  • Divisiones :

Separar Ejemplos
'test' 4,182
'train' 16,728

escanear/añadirprim_jump

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.53 MiB

  • Divisiones :

Separar Ejemplos
'test' 7,706
'train' 14,670

escanear/addprim_turn_left

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.58 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,208
'train' 21,890

escanear/filler_num0

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 3.20 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,173
'train' 15,225

escanear/filler_num1

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 3.51 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,173
'train' 16,290

escanear/filler_num2

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 3.84 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,173
'train' 17,391

escanear/relleno_num3

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.17 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,173
'train' 18,528

escaneo/longitud

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.47 MiB

  • Divisiones :

Separar Ejemplos
'test' 3,920
'train' 16,990

escanear/plantilla_alrededor_derecho

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.17 MiB

  • Divisiones :

Separar Ejemplos
'test' 4,476
'train' 15,225

escanear/template_jump_around_right

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.17 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,173
'train' 18,528

escanear/template_opposite_right

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.22 MiB

  • Divisiones :

Separar Ejemplos
'test' 4,476
'train' 15,225

escanear/plantilla_derecha

  • Tamaño de la descarga : 17.82 MiB

  • Tamaño del conjunto de datos : 4.26 MiB

  • Divisiones :

Separar Ejemplos
'test' 4,476
'train' 15,225

escanear/mcd1

  • Tamaño de la descarga : 17.89 MiB

  • Tamaño del conjunto de datos : 1.89 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,045
'train' 8,365

escanear/mcd2

  • Tamaño de la descarga : 17.89 MiB

  • Tamaño del conjunto de datos : 1.84 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,045
'train' 8,365

escanear/mcd3

  • Tamaño de la descarga : 17.89 MiB

  • Tamaño del conjunto de datos : 1.87 MiB

  • Divisiones :

Separar Ejemplos
'test' 1,045
'train' 8,365