Ajuda a proteger a Grande Barreira de Corais com TensorFlow em Kaggle Junte Desafio

xquad

  • Descrição:

XQuAD (Cross-lingual Question Answer Dataset) é um conjunto de dados de referência para avaliar o desempenho de respostas a perguntas em vários idiomas. O conjunto de dados consiste em um subconjunto de 240 parágrafos e 1190 pares de perguntas e respostas do conjunto de desenvolvimento do SQuAD v1.1 (Rajpurkar et al., 2016), juntamente com suas traduções profissionais em dez idiomas: espanhol, alemão, grego, russo, turco , Árabe, vietnamita, tailandês, chinês e hindi. Consequentemente, o conjunto de dados é totalmente paralelo em 11 idiomas. Para executar XQuAD no cenário-shot de zero padrão, use os dados de treinamento v1.1 e validação esquadrão aqui: https://www.tensorflow.org/datasets/catalog/squad

Também incluímos as divisões "translate-train", "translate-dev" e "translate-test" para cada idioma diferente do inglês da XTREME (Hu et al., 2020). Eles podem ser usados ​​para executar o XQuAD nas configurações "translate-train" ou "translate-test".

  • Homepage: https://github.com/deepmind/xquad

  • O código-fonte: tfds.question_answering.Xquad

  • versões:

    • 3.0.0 (padrão): Corrige problema com um número de exemplos onde vãos resposta estão desalinhados devido ao contexto de remoção de espaço em branco. Essa mudança afeta cerca de 14% dos exemplos de teste.
  • Características:

FeaturesDict({
    'answers': Sequence({
        'answer_start': tf.int32,
        'text': Text(shape=(), dtype=tf.string),
    }),
    'context': Text(shape=(), dtype=tf.string),
    'id': tf.string,
    'question': Text(shape=(), dtype=tf.string),
    'title': Text(shape=(), dtype=tf.string),
})
@article{Artetxe:etal:2019,
      author    = {Mikel Artetxe and Sebastian Ruder and Dani Yogatama},
      title     = {On the cross-lingual transferability of monolingual representations},
      journal   = {CoRR},
      volume    = {abs/1910.11856},
      year      = {2019},
      archivePrefix = {arXiv},
      eprint    = {1910.11856}
}

xquad / ar (configuração padrão)

  • Descrição Config: divisão de teste 'AR' XQuAD, com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME (Hu et al, 2020.).

  • Tamanho do download: 420.97 MiB

  • Dataset size: 134.83 MiB

  • Cache-Auto ( documentação ): Sim

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.541
'translate-test' 1.151
'translate-train' 86.787

xquad / de

  • Configuração Descrição: (., Hu et al, 2020) XQuAD 'de' divisão de teste, com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME.

  • Tamanho do download: 127.04 MiB

  • Dataset tamanho: 98.80 MiB

  • Cache-Auto ( documentação ): Sim

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.371
'translate-test' 1.168
'translate-train' 82.603

xquad / el

  • Descrição Config: dividida teste XQuAD 'el', com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME (Hu et al, 2020.).

  • Tamanho do download: 499.40 MiB

  • Dataset tamanho: 157.90 MiB

  • Cache-Auto ( documentação ): Sim (ensaio, traduzir-dev, traduzir-teste), Só quando shuffle_files=False (traduzir-trem)

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.100
'translate-test' 1.182
'translate-train' 79.946

xquad / es

  • Descrição Config: dividida teste XQuAD 'ES', com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME (Hu et al, 2020.).

  • Tamanho do download: 138.41 MiB

  • Dataset size: 104.96 MiB

  • Cache-Auto ( documentação ): Sim

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.566
'translate-test' 1.188
'translate-train' 87.488

xquad / hi

  • Descrição Config: 'oi' dividida teste XQuAD, com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME (Hu et al, 2020.).

  • Tamanho do download: 472.23 MiB

  • Dataset size: 207.85 MiB

  • Cache-Auto ( documentação ): Sim (ensaio, traduzir-dev, traduzir-teste), Só quando shuffle_files=False (traduzir-trem)

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.536
'translate-test' 1.184
'translate-train' 85.804

xquad / ru

  • Descrição Config: dividida teste XQuAD 'ru', com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME (Hu et al, 2020.).

  • Tamanho do download: 513.80 MiB

  • Dataset size: 159.38 MiB

  • Cache-Auto ( documentação ): Sim (ensaio, traduzir-dev, traduzir-teste), Só quando shuffle_files=False (traduzir-trem)

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.469
'translate-test' 1.190
'translate-train' 84.869

xquad / th

  • Descrição Config: divisão de teste 'th' XQuAD, com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME (Hu et al, 2020.).

  • Tamanho do download: 461.54 MiB

  • Dataset size: 199.57 MiB

  • Cache-Auto ( documentação ): Sim (ensaio, traduzir-dev, traduzir-teste), Só quando shuffle_files=False (traduzir-trem)

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.516
'translate-test' 1.157
'translate-train' 85.846

xquad / tr

  • Descrição Config: divisão de teste 'tr' XQuAD, com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME (Hu et al, 2020.).

  • Tamanho do download: 151.08 MiB

  • Dataset tamanho: 97.56 MiB

  • Cache-Auto ( documentação ): Sim

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.535
'translate-test' 1.112
'translate-train' 86.511

xquad / vi

  • Configuração Descrição: (., Hu et al, 2020) XQuAD 'vi' divisão de teste, com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME.

  • Tamanho do download: 218.09 MiB

  • Dataset tamanho: 120.03 MiB

  • Cache-Auto ( documentação ): Sim

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.555
'translate-test' 1.178
'translate-train' 87.187

xquad / zh

  • Descrição Config: divisão de teste 'zh' XQuAD, com separações traduzido-máquina traduzir-de comboio / traduzir-dev / traduzem-teste de XTREME (Hu et al, 2020.).

  • Tamanho do download: 174.57 MiB

  • Dataset tamanho: 80.79 MiB

  • Cache-Auto ( documentação ): Sim

  • desdobramentos:

Dividir Exemplos
'test' 1.190
'translate-dev' 10.475
'translate-test' 1.186
'translate-train' 85.700

xquad / en

  • A inscrição Config: XQuAD 'en' dividir teste.

  • Tamanho do download: 595.10 KiB

  • Conjunto de dados de tamanho: 1.19 MiB

  • Cache-Auto ( documentação ): Sim

  • desdobramentos:

Dividir Exemplos
'test' 1.190