- Sự miêu tả :
Lập trình Python ít cơ bản hơn là tập hợp 161 bài toán lập trình kèm theo các bài kiểm tra đơn vị. Chúng được tạo ra với mục đích là mới (không bị rò rỉ tại thời điểm tạo) và khó hơn các bộ dữ liệu tương tự (ví dụ: HumanEval và MBPP). Nó có thể đóng vai trò thay thế hoặc làm phong phú thêm các bộ dữ liệu đó khi chúng được cấu trúc theo cách tương đương.
Trang chủ : https://aclanthology.org/2024.findings-emnlp.772/
Mã nguồn :
tfds.datasets.lbpp.Builder
Phiên bản :
-
2.0.0
(mặc định): Không có ghi chú phát hành.
-
Tự động lưu vào bộ nhớ đệm ( tài liệu ): Có
Cấu trúc tính năng :
FeaturesDict({
'categories': Sequence(Text(shape=(), dtype=string)),
'completion': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'language': Text(shape=(), dtype=string),
'signature': Text(shape=(), dtype=string),
'task_id': Text(shape=(), dtype=string),
'test_file': Text(shape=(), dtype=string),
'test_list': Sequence(Text(shape=(), dtype=string)),
'test_setup': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- Tài liệu tính năng :
Tính năng | Lớp học | Hình dạng | loại D | Sự miêu tả |
---|---|---|---|---|
Tính năngDict | ||||
Thể loại | Trình tự(Văn bản) | (Không có,) | sợi dây | |
hoàn thành | Chữ | sợi dây | ||
chỉ dẫn | Chữ | sợi dây | ||
ngôn ngữ | Chữ | sợi dây | ||
chữ ký | Chữ | sợi dây | ||
nhiệm vụ_id | Chữ | sợi dây | ||
tập tin kiểm tra | Chữ | sợi dây | ||
danh sách kiểm tra | Trình tự(Văn bản) | (Không có,) | sợi dây | |
test_setup | Chữ | sợi dây | ||
tiêu đề | Chữ | sợi dây |
Khóa được giám sát (Xem
as_supervised
doc ):None
Hình ( tfds.show_examples ): Không được hỗ trợ.
Trích dẫn :
@inproceedings{matton-etal-2024-leakage,
title = "On Leakage of Code Generation Evaluation Datasets",
author = "Matton, Alexandre and
Sherborne, Tom and
Aumiller, Dennis and
Tommasone, Elena and
Alizadeh, Milad and
He, Jingyi and
Ma, Raymond and
Voisin, Maxime and
Gilsenan-McMahon, Ellen and
Gall{\'e}, Matthias",
editor = "Al-Onaizan, Yaser and
Bansal, Mohit and
Chen, Yun-Nung",
booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2024",
month = nov,
year = "2024",
address = "Miami, Florida, USA",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.findings-emnlp.772/",
doi = "10.18653/v1/2024.findings-emnlp.772",
pages = "13215--13223",
}
lbpp/all (cấu hình mặc định)
Mô tả cấu hình : LBPP đa ngôn ngữ
Kích thước tải xuống :
1.78 MiB
Kích thước tập dữ liệu :
4.30 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 944 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/đa ngôn ngữ
Mô tả cấu hình : LBPP đa ngôn ngữ
Kích thước tải xuống :
1.78 MiB
Kích thước tập dữ liệu :
4.30 MiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 944 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/mặc định
Mô tả cấu hình : Python LBPP
Kích thước tải xuống :
279.90 KiB
Kích thước tập dữ liệu :
627.04 KiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 162 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/trăn
Mô tả cấu hình : Python LBPP
Kích thước tải xuống :
279.90 KiB
Kích thước tập dữ liệu :
627.04 KiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 162 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/cpp
Mô tả cấu hình : C++ LBPP
Kích thước tải xuống :
314.45 KiB
Kích thước tập dữ liệu :
761.87 KiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 161 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/đi
Mô tả cấu hình : Go LBPP
Kích thước tải xuống :
317.09 KiB
Kích thước tập dữ liệu :
687.23 KiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 161 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/java
Mô tả cấu hình : Java LBPP
Kích thước tải xuống :
337.90 KiB
Kích thước tập dữ liệu :
887.40 KiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 158 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/js
Mô tả cấu hình : JavaScript LBPP
Kích thước tải xuống :
303.40 KiB
Kích thước tập dữ liệu :
756.69 KiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 153 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/javascript
Mô tả cấu hình : JavaScript LBPP
Kích thước tải xuống :
303.40 KiB
Kích thước tập dữ liệu :
756.69 KiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 153 |
- Ví dụ ( tfds.as_dataframe ):
lbpp/rỉ sét
Mô tả cấu hình : JavaScript LBPP
Kích thước tải xuống :
272.61 KiB
Kích thước tập dữ liệu :
684.31 KiB
Chia tách :
Tách ra | Ví dụ |
---|---|
'test' | 149 |
- Ví dụ ( tfds.as_dataframe ):