reddit_tifu

Người giới thiệu:

ngắn

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:reddit_tifu/short')
 • Sự miêu tả :
Reddit dataset, where TIFU denotes the name of subbreddit /r/tifu.
As defined in the publication, styel "short" uses title as summary and
"long" uses tldr as summary.

Features includes:
 - document: post text without tldr.
 - tldr: tldr line.
 - title: trimmed title without tldr.
 - ups: upvotes.
 - score: score.
 - num_comments: number of comments.
 - upvote_ratio: upvote ratio.
 • Giấy phép : Không có giấy phép được biết đến
 • Phiên bản : 1.1.0
 • Chia tách :
Tách ra Ví dụ
'train' 79740
 • Đặc trưng :
{
  "ups": {
    "dtype": "float32",
    "id": null,
    "_type": "Value"
  },
  "num_comments": {
    "dtype": "float32",
    "id": null,
    "_type": "Value"
  },
  "upvote_ratio": {
    "dtype": "float32",
    "id": null,
    "_type": "Value"
  },
  "score": {
    "dtype": "float32",
    "id": null,
    "_type": "Value"
  },
  "documents": {
    "dtype": "string",
    "id": null,
    "_type": "Value"
  },
  "tldr": {
    "dtype": "string",
    "id": null,
    "_type": "Value"
  },
  "title": {
    "dtype": "string",
    "id": null,
    "_type": "Value"
  }
}

dài

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:reddit_tifu/long')
 • Sự miêu tả :
Reddit dataset, where TIFU denotes the name of subbreddit /r/tifu.
As defined in the publication, styel "short" uses title as summary and
"long" uses tldr as summary.

Features includes:
 - document: post text without tldr.
 - tldr: tldr line.
 - title: trimmed title without tldr.
 - ups: upvotes.
 - score: score.
 - num_comments: number of comments.
 - upvote_ratio: upvote ratio.
 • Giấy phép : Không có giấy phép được biết đến
 • Phiên bản : 1.1.0
 • Chia tách :
Tách ra Ví dụ
'train' 42139
 • Đặc trưng :
{
  "ups": {
    "dtype": "float32",
    "id": null,
    "_type": "Value"
  },
  "num_comments": {
    "dtype": "float32",
    "id": null,
    "_type": "Value"
  },
  "upvote_ratio": {
    "dtype": "float32",
    "id": null,
    "_type": "Value"
  },
  "score": {
    "dtype": "float32",
    "id": null,
    "_type": "Value"
  },
  "documents": {
    "dtype": "string",
    "id": null,
    "_type": "Value"
  },
  "tldr": {
    "dtype": "string",
    "id": null,
    "_type": "Value"
  },
  "title": {
    "dtype": "string",
    "id": null,
    "_type": "Value"
  }
}