Ayuda a proteger la Gran Barrera de Coral con TensorFlow en Kaggle Únete Challenge

lm1b

  • Descripción:

Un corpus de referencia que se utilizará para medir el progreso en el modelado de lenguaje estadístico. Esto tiene casi mil millones de palabras en los datos de entrenamiento.

Separar Ejemplos de
'test' 306,688
'train' 30.301.028
  • características:
FeaturesDict({
    'text': Text(shape=(), dtype=tf.string),
})
  • Cita:
@article{DBLP:journals/corr/ChelbaMSGBK13,
  author    = {Ciprian Chelba and
               Tomas Mikolov and
               Mike Schuster and
               Qi Ge and
               Thorsten Brants and
               Phillipp Koehn},
  title     = {One Billion Word Benchmark for Measuring Progress in Statistical Language
               Modeling},
  journal   = {CoRR},
  volume    = {abs/1312.3005},
  year      = {2013},
  url       = {http://arxiv.org/abs/1312.3005},
  archivePrefix = {arXiv},
  eprint    = {1312.3005},
  timestamp = {Mon, 13 Aug 2018 16:46:16 +0200},
  biburl    = {https://dblp.org/rec/bib/journals/corr/ChelbaMSGBK13},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}