- विवरण :
कम बुनियादी पायथन प्रोग्रामिंग यूनिट परीक्षणों के साथ 161 प्रोग्रामिंग समस्याओं का एक संग्रह है। इन्हें ताज़ा बनाने (निर्माण के समय लीक नहीं होने) और समान डेटासेट (उदाहरण के लिए, ह्यूमनएवल और एमबीपीपी) की तुलना में अधिक कठिन होने के उद्देश्य से बनाया गया था। यह उन डेटासेट के ड्रॉप-इन प्रतिस्थापन या संवर्धन के रूप में काम कर सकता है क्योंकि वे एक समान तरीके से संरचित हैं।
मुखपृष्ठ : https://aclanthology.org/2024.findings-emnlp.772/
स्रोत कोड :
tfds.datasets.lbpp.Builder
संस्करण :
-
2.0.0
(डिफ़ॉल्ट): कोई रिलीज़ नोट नहीं।
-
ऑटो-कैश्ड ( दस्तावेज़ीकरण ): हाँ
फ़ीचर संरचना :
FeaturesDict({
'categories': Sequence(Text(shape=(), dtype=string)),
'completion': Text(shape=(), dtype=string),
'instruction': Text(shape=(), dtype=string),
'language': Text(shape=(), dtype=string),
'signature': Text(shape=(), dtype=string),
'task_id': Text(shape=(), dtype=string),
'test_file': Text(shape=(), dtype=string),
'test_list': Sequence(Text(shape=(), dtype=string)),
'test_setup': Text(shape=(), dtype=string),
'title': Text(shape=(), dtype=string),
})
- फ़ीचर दस्तावेज़ीकरण :
विशेषता | कक्षा | आकार | डीप्रकार | विवरण |
---|---|---|---|---|
फीचर्सडिक्ट | ||||
श्रेणियाँ | अनुक्रम(पाठ) | (कोई नहीं,) | डोरी | |
समापन | मूलपाठ | डोरी | ||
अनुदेश | मूलपाठ | डोरी | ||
भाषा | मूलपाठ | डोरी | ||
हस्ताक्षर | मूलपाठ | डोरी | ||
कार्य_आईडी | मूलपाठ | डोरी | ||
test_file | मूलपाठ | डोरी | ||
परीक्षण_सूची | अनुक्रम(पाठ) | (कोई नहीं,) | डोरी | |
test_setup | मूलपाठ | डोरी | ||
शीर्षक | मूलपाठ | डोरी |
पर्यवेक्षित कुंजियाँ (
as_supervised
doc देखें):None
चित्र ( tfds.show_examples ): समर्थित नहीं है।
उद्धरण :
@inproceedings{matton-etal-2024-leakage,
title = "On Leakage of Code Generation Evaluation Datasets",
author = "Matton, Alexandre and
Sherborne, Tom and
Aumiller, Dennis and
Tommasone, Elena and
Alizadeh, Milad and
He, Jingyi and
Ma, Raymond and
Voisin, Maxime and
Gilsenan-McMahon, Ellen and
Gall{\'e}, Matthias",
editor = "Al-Onaizan, Yaser and
Bansal, Mohit and
Chen, Yun-Nung",
booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2024",
month = nov,
year = "2024",
address = "Miami, Florida, USA",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2024.findings-emnlp.772/",
doi = "10.18653/v1/2024.findings-emnlp.772",
pages = "13215--13223",
}
एलबीपीपी/सभी (डिफ़ॉल्ट कॉन्फ़िगरेशन)
कॉन्फ़िगरेशन विवरण : बहुभाषी एलबीपीपी
डाउनलोड आकार :
1.78 MiB
डेटासेट का आकार :
4.30 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 944 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/बहुभाषी
कॉन्फ़िगरेशन विवरण : बहुभाषी एलबीपीपी
डाउनलोड आकार :
1.78 MiB
डेटासेट का आकार :
4.30 MiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 944 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/डिफ़ॉल्ट
कॉन्फ़िगरेशन विवरण : पायथन एलबीपीपी
डाउनलोड आकार :
279.90 KiB
डेटासेट का आकार :
627.04 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 162 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/पायथन
कॉन्फ़िगरेशन विवरण : पायथन एलबीपीपी
डाउनलोड आकार :
279.90 KiB
डेटासेट का आकार :
627.04 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 162 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/सीपीपी
कॉन्फ़िगरेशन विवरण : C++ LBPP
डाउनलोड आकार :
314.45 KiB
डेटासेट का आकार :
761.87 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 161 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/गो
कॉन्फ़िगरेशन विवरण : एलबीपीपी पर जाएं
डाउनलोड आकार :
317.09 KiB
डेटासेट का आकार :
687.23 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 161 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/जावा
कॉन्फ़िगरेशन विवरण : जावा एलबीपीपी
डाउनलोड आकार :
337.90 KiB
डेटासेट का आकार :
887.40 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 158 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/जेएस
कॉन्फ़िगरेशन विवरण : जावास्क्रिप्ट एलबीपीपी
डाउनलोड आकार :
303.40 KiB
डेटासेट का आकार :
756.69 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 153 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/जावास्क्रिप्ट
कॉन्फ़िगरेशन विवरण : जावास्क्रिप्ट एलबीपीपी
डाउनलोड आकार :
303.40 KiB
डेटासेट का आकार :
756.69 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 153 |
- उदाहरण ( tfds.as_dataframe ):
एलबीपीपी/जंग
कॉन्फ़िगरेशन विवरण : जावास्क्रिप्ट एलबीपीपी
डाउनलोड आकार :
272.61 KiB
डेटासेट का आकार :
684.31 KiB
विभाजन :
विभाजित करना | उदाहरण |
---|---|
'test' | 149 |
- उदाहरण ( tfds.as_dataframe ):