Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

opinie_streszczenia

  • opis:

Istnieją dwa podzbiory danych:

(1) Rotten Tomatoes: Krytycy filmowe i konsensus indeksowane od http://rottentomatoes.com/ Ma pola „_movie_name”, „_movie_id”, „_critics” i „_critic_consensus”.

(2) IDebate: Argumenty indeksowane od http://idebate.org/ Ma pola "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

Opinion_abstracts/rotten_tomatoes (domyślna konfiguracja)

  • Opis config: krytycy profesjonalne i konsensusu 3,731 filmów.

  • Zbiór danych rozmiar: 50.10 MiB

  • dzieli:

Podział Przykłady
'train' 3731
  • Cechy:
FeaturesDict({
    '_critic_consensus': tf.string,
    '_critics': Sequence({
        'key': tf.string,
        'value': tf.string,
    }),
    '_movie_id': tf.string,
    '_movie_name': tf.string,
})

opinie_abstrakty/debata

  • Opis config: 2,259 roszczenia 676 debat.

  • Zestaw danych rozmiar: 3.15 MiB

  • dzieli:

Podział Przykłady
'train' 2259
  • Cechy:
FeaturesDict({
    '_argument_sentences': Sequence({
        'key': tf.string,
        'value': tf.string,
    }),
    '_claim': tf.string,
    '_claim_id': tf.string,
    '_debate_name': tf.string,
})