lbpp

  • Sự miêu tả :

Lập trình Python ít cơ bản hơn là tập hợp 161 bài toán lập trình kèm theo các bài kiểm tra đơn vị. Chúng được tạo ra với mục đích là mới (không bị rò rỉ tại thời điểm tạo) và khó hơn các bộ dữ liệu tương tự (ví dụ: HumanEval và MBPP). Nó có thể đóng vai trò thay thế hoặc làm phong phú thêm các bộ dữ liệu đó khi chúng được cấu trúc theo cách tương đương.

FeaturesDict({
    'categories': Sequence(Text(shape=(), dtype=string)),
    'completion': Text(shape=(), dtype=string),
    'instruction': Text(shape=(), dtype=string),
    'language': Text(shape=(), dtype=string),
    'signature': Text(shape=(), dtype=string),
    'task_id': Text(shape=(), dtype=string),
    'test_file': Text(shape=(), dtype=string),
    'test_list': Sequence(Text(shape=(), dtype=string)),
    'test_setup': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • Tài liệu tính năng :
Tính năng Lớp học Hình dạng loại D Sự miêu tả
Tính năngDict
Thể loại Trình tự(Văn bản) (Không có,) sợi dây
hoàn thành Chữ sợi dây
chỉ dẫn Chữ sợi dây
ngôn ngữ Chữ sợi dây
chữ ký Chữ sợi dây
nhiệm vụ_id Chữ sợi dây
tập tin kiểm tra Chữ sợi dây
danh sách kiểm tra Trình tự(Văn bản) (Không có,) sợi dây
test_setup Chữ sợi dây
tiêu đề Chữ sợi dây
@inproceedings{matton-etal-2024-leakage,
    title = "On Leakage of Code Generation Evaluation Datasets",
    author = "Matton, Alexandre  and
      Sherborne, Tom  and
      Aumiller, Dennis  and
      Tommasone, Elena  and
      Alizadeh, Milad  and
      He, Jingyi  and
      Ma, Raymond  and
      Voisin, Maxime  and
      Gilsenan-McMahon, Ellen  and
      Gall{\'e}, Matthias",
    editor = "Al-Onaizan, Yaser  and
      Bansal, Mohit  and
      Chen, Yun-Nung",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2024",
    month = nov,
    year = "2024",
    address = "Miami, Florida, USA",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2024.findings-emnlp.772/",
    doi = "10.18653/v1/2024.findings-emnlp.772",
    pages = "13215--13223",
}

lbpp/all (cấu hình mặc định)

  • Mô tả cấu hình : LBPP đa ngôn ngữ

  • Kích thước tải xuống : 1.78 MiB

  • Kích thước tập dữ liệu : 4.30 MiB

  • Chia tách :

Tách ra Ví dụ
'test' 944

lbpp/đa ngôn ngữ

  • Mô tả cấu hình : LBPP đa ngôn ngữ

  • Kích thước tải xuống : 1.78 MiB

  • Kích thước tập dữ liệu : 4.30 MiB

  • Chia tách :

Tách ra Ví dụ
'test' 944

lbpp/mặc định

  • Mô tả cấu hình : Python LBPP

  • Kích thước tải xuống : 279.90 KiB

  • Kích thước tập dữ liệu : 627.04 KiB

  • Chia tách :

Tách ra Ví dụ
'test' 162

lbpp/trăn

  • Mô tả cấu hình : Python LBPP

  • Kích thước tải xuống : 279.90 KiB

  • Kích thước tập dữ liệu : 627.04 KiB

  • Chia tách :

Tách ra Ví dụ
'test' 162

lbpp/cpp

  • Mô tả cấu hình : C++ LBPP

  • Kích thước tải xuống : 314.45 KiB

  • Kích thước tập dữ liệu : 761.87 KiB

  • Chia tách :

Tách ra Ví dụ
'test' 161

lbpp/đi

  • Mô tả cấu hình : Go LBPP

  • Kích thước tải xuống : 317.09 KiB

  • Kích thước tập dữ liệu : 687.23 KiB

  • Chia tách :

Tách ra Ví dụ
'test' 161

lbpp/java

  • Mô tả cấu hình : Java LBPP

  • Kích thước tải xuống : 337.90 KiB

  • Kích thước tập dữ liệu : 887.40 KiB

  • Chia tách :

Tách ra Ví dụ
'test' 158

lbpp/js

  • Mô tả cấu hình : JavaScript LBPP

  • Kích thước tải xuống : 303.40 KiB

  • Kích thước tập dữ liệu : 756.69 KiB

  • Chia tách :

Tách ra Ví dụ
'test' 153

lbpp/javascript

  • Mô tả cấu hình : JavaScript LBPP

  • Kích thước tải xuống : 303.40 KiB

  • Kích thước tập dữ liệu : 756.69 KiB

  • Chia tách :

Tách ra Ví dụ
'test' 153

lbpp/rỉ sét

  • Mô tả cấu hình : JavaScript LBPP

  • Kích thước tải xuống : 272.61 KiB

  • Kích thước tập dữ liệu : 684.31 KiB

  • Chia tách :

Tách ra Ví dụ
'test' 149