- תיאור :
ישנם שני מערכי משנה:
(1) RottenTomatoes: מבקרי הסרט והקונצנזוס זחלו מ- http://rottentomatoes.com/ יש לו שדות של "_movie_name", "_movie_id", "_critics" ו-"_critic_consensus".
(2) IDebate: הטיעונים שנסרקו מ- http://idebate.org/ יש לו שדות של "_debate_name", "_debate_id", "_claim", "_claim_id", "_argument_sences".
ראה גם https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txt
קוד מקור :
tfds.datasets.opinion_abstracts.Builder
גרסאות :
-
1.0.0
(ברירת מחדל): אין הערות שחרור.
-
גודל הורדה :
20.08 MiB
שמור אוטומטי במטמון ( תיעוד ): כן
איור ( tfds.show_examples ): לא נתמך.
ציטוט :
@inproceedings{wang-ling-2016-neural,
title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
author = "Wang, Lu and
Ling, Wang",
booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
month = jun,
year = "2016",
address = "San Diego, California",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/N16-1007",
doi = "10.18653/v1/N16-1007",
pages = "47--57",
}
opinion_abstracts/rotten_tomatoes (תצורת ברירת מחדל)
תיאור תצורה : מבקרים מקצועיים והסכמה של 3,731 סרטים.
גודל מערך נתונים :
50.10 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 3,731 |
- מבנה תכונה :
FeaturesDict({
'_critic_consensus': string,
'_critics': Sequence({
'key': string,
'value': string,
}),
'_movie_id': string,
'_movie_name': string,
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
קונצנזוס_מבקר | מוֹתֵחַ | חוּט | ||
_מבקרים | סדר פעולות | |||
_מבקרים/מפתח | מוֹתֵחַ | חוּט | ||
_מבקרים/ערך | מוֹתֵחַ | חוּט | ||
_מזהה_סרט | מוֹתֵחַ | חוּט | ||
_שם_סרט | מוֹתֵחַ | חוּט |
מפתחות בפיקוח (ראה כמסמך
as_supervised
):('_critics', '_critic_consensus')
דוגמאות ( tfds.as_dataframe ):
תקצירי_דעות/רעיון
תיאור תצורה : 2,259 טענות עבור 676 דיונים.
גודל ערכת נתונים :
3.15 MiB
פיצולים :
לְפַצֵל | דוגמאות |
---|---|
'train' | 2,259 |
- מבנה תכונה :
FeaturesDict({
'_argument_sentences': Sequence({
'key': string,
'value': string,
}),
'_claim': string,
'_claim_id': string,
'_debate_name': string,
})
- תיעוד תכונה :
תכונה | מעמד | צוּרָה | Dtype | תיאור |
---|---|---|---|---|
FeaturesDict | ||||
משפטי_טיעון | סדר פעולות | |||
_משפט_טיעון/מפתח | מוֹתֵחַ | חוּט | ||
משפטי_טיעון/ערך | מוֹתֵחַ | חוּט | ||
_תְבִיעָה | מוֹתֵחַ | חוּט | ||
מזהה_תביעה | מוֹתֵחַ | חוּט | ||
_שם_דיון | מוֹתֵחַ | חוּט |
מפתחות בפיקוח (ראה כמסמך
as_supervised
):('_argument_sentences', '_claim')
דוגמאות ( tfds.as_dataframe ):