so_stackmẫu

Người giới thiệu:

Câu trả lời

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:so_stacksample/Answers')
  • Sự miêu tả :
Dataset with the text of 10% of questions and answers from the Stack Overflow programming Q&A website.

This is organized as three tables:

Questions contains the title, body, creation date, closed date (if applicable), score, and owner ID for all non-deleted Stack Overflow questions whose Id is a multiple of 10.
Answers contains the body, creation date, score, and owner ID for each of the answers to these questions. The ParentId column links back to the Questions table.
Tags contains the tags on each of these questions
  • Giấy phép : Tất cả các đóng góp của người dùng Stack Overflow đều được cấp phép theo CC-BY-SA 3.0 với yêu cầu ghi công.
  • Phiên bản : 1.1.0
  • Chia tách :
Tách ra Ví dụ
'Answers' 2014516
  • Đặc trưng :
{
    "Id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "OwnerUserId": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "CreationDate": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "ParentId": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "Score": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "Body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

Câu hỏi

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:so_stacksample/Questions')
  • Sự miêu tả :
Dataset with the text of 10% of questions and answers from the Stack Overflow programming Q&A website.

This is organized as three tables:

Questions contains the title, body, creation date, closed date (if applicable), score, and owner ID for all non-deleted Stack Overflow questions whose Id is a multiple of 10.
Answers contains the body, creation date, score, and owner ID for each of the answers to these questions. The ParentId column links back to the Questions table.
Tags contains the tags on each of these questions
  • Giấy phép : Tất cả các đóng góp của người dùng Stack Overflow đều được cấp phép theo CC-BY-SA 3.0 với yêu cầu ghi công.
  • Phiên bản : 1.1.0
  • Chia tách :
Tách ra Ví dụ
'Questions' 1264216
  • Đặc trưng :
{
    "Id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "OwnerUserId": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "CreationDate": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "ClosedDate": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "Score": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "Title": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    },
    "Body": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}

Thẻ

Sử dụng lệnh sau để tải tập dữ liệu này trong TFDS:

ds = tfds.load('huggingface:so_stacksample/Tags')
  • Sự miêu tả :
Dataset with the text of 10% of questions and answers from the Stack Overflow programming Q&A website.

This is organized as three tables:

Questions contains the title, body, creation date, closed date (if applicable), score, and owner ID for all non-deleted Stack Overflow questions whose Id is a multiple of 10.
Answers contains the body, creation date, score, and owner ID for each of the answers to these questions. The ParentId column links back to the Questions table.
Tags contains the tags on each of these questions
  • Giấy phép : Tất cả các đóng góp của người dùng Stack Overflow đều được cấp phép theo CC-BY-SA 3.0 với yêu cầu ghi công.
  • Phiên bản : 1.1.0
  • Chia tách :
Tách ra Ví dụ
'Tags' 3750994
  • Đặc trưng :
{
    "Id": {
        "dtype": "int32",
        "id": null,
        "_type": "Value"
    },
    "Tag": {
        "dtype": "string",
        "id": null,
        "_type": "Value"
    }
}