- Descripción :
Hay dos subconjuntos de datos:
(1) RottenTomatoes: los críticos de cine y el consenso se rastrearon desde http://rottentomatoes.com/ Tiene campos de "_movie_name", "_movie_id", "_critics" y "_critic_consensus".
(2) IDebate: Los argumentos rastreados desde http://idebate.org/ Tiene campos de "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sentences".
Página de inicio : http://www.ccs.neu.edu/home/luwang/data.html
Código fuente :
tfds.summarization.OpinionAbstracts
Versiones :
-
1.0.0
(predeterminado): Sin notas de la versión.
-
Tamaño de descarga :
20.08 MiB
Almacenamiento automático en caché ( documentación ): Sí
Figura ( tfds.show_examples ): no compatible.
Ejemplos ( tfds.as_dataframe ): Falta.
Cita :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
opinion_abstracts/rotten_tomatoes (configuración predeterminada)
Descripción de la configuración : críticos profesionales y consenso de 3.731 películas.
Tamaño del conjunto de datos :
50.10 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 3,731 |
- Estructura de características :
FeaturesDict({
'_critic_consensus': tf.string,
'_critics': Sequence({
'key': tf.string,
'value': tf.string,
}),
'_movie_id': tf.string,
'_movie_name': tf.string,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
_critic_consensus | Tensor | tf.cadena | ||
_criticos | Secuencia | |||
_críticos/clave | Tensor | tf.cadena | ||
_críticas/valor | Tensor | tf.cadena | ||
_movie_id | Tensor | tf.cadena | ||
_nombre de pelicula | Tensor | tf.cadena |
- Claves supervisadas (Ver
as_supervised
):('_critics', '_critic_consensus')
opinion_abstracts/idebate
Descripción de la configuración : 2259 reclamos para 676 debates.
Tamaño del conjunto de datos :
3.15 MiB
Divisiones :
Separar | Ejemplos |
---|---|
'train' | 2,259 |
- Estructura de características :
FeaturesDict({
'_argument_sentences': Sequence({
'key': tf.string,
'value': tf.string,
}),
'_claim': tf.string,
'_claim_id': tf.string,
'_debate_name': tf.string,
})
- Documentación de características :
Rasgo | Clase | Forma | Tipo D | Descripción |
---|---|---|---|---|
CaracterísticasDict | ||||
_argumento_frases | Secuencia | |||
_argumento_frases/clave | Tensor | tf.cadena | ||
_argumento_frases/valor | Tensor | tf.cadena | ||
_reclamar | Tensor | tf.cadena | ||
_claim_id | Tensor | tf.cadena | ||
_debate_nombre | Tensor | tf.cadena |
- Claves supervisadas (ver
as_supervised
):('_argument_sentences', '_claim')