意見_abstracts

  • 説明:

2 つのサブ データセットがあります。

(1) RottenTomatoes: http://rottentomatoes.com/からクロールした映画評論家とコンセンサス。「_movie_name」、「_movie_id」、「_critics」、および「_c​​ritic_consensus」のフィールドがあります。

(2) IDebate: http://idebate.org/からクロールされた引数 "_debate_name"、"_debate_id"、"_claim"、"_claim_id"、"_argument_sentences" のフィールドがあります。

https://web.eecs.umich.edu/~wangluxy/datasets/opinion_README.txtも参照してください

@inproceedings{wang-ling-2016-neural,
    title = "Neural Network-Based Abstract Generation for Opinions and Arguments",
    author = "Wang, Lu  and
      Ling, Wang",
    booktitle = "Proceedings of the 2016 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies",
    month = jun,
    year = "2016",
    address = "San Diego, California",
    publisher = "Association for Computational Linguistics",
    url = "https://www.aclweb.org/anthology/N16-1007",
    doi = "10.18653/v1/N16-1007",
    pages = "47--57",
}

Opinion_abstracts/rotten_tomatoes (デフォルト設定)

  • 構成の説明: 3,731 本の映画のプロの批評家とコンセンサス。

  • データセットのサイズ: 50.10 MiB

  • スプリット:

スプリット
'train' 3,731
  • 機能構造:
FeaturesDict({
    '_critic_consensus': string,
    '_critics': Sequence({
        'key': string,
        'value': string,
    }),
    '_movie_id': string,
    '_movie_name': string,
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
_critic_consensusテンソル
_批評家順序
_批評家/キーテンソル
_批評家/値テンソル
_movie_idテンソル
_movie_nameテンソル

オピニオン_アブストラクト/イデベート

  • 構成の説明: 676 件の討論に対して 2,259 件の主張。

  • データセットのサイズ: 3.15 MiB

  • スプリット:

スプリット
'train' 2,259
  • 機能構造:
FeaturesDict({
    '_argument_sentences': Sequence({
        'key': string,
        'value': string,
    }),
    '_claim': string,
    '_claim_id': string,
    '_debate_name': string,
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
_argument_sentences順序
_argument_sentences/keyテンソル
_argument_sentences/値テンソル
_請求テンソル
_claim_idテンソル
_debate_nameテンソル