lbpp

  • תיאור :

תכנות פייתון פחות בסיסי הוא אוסף של 161 בעיות תכנות עם בדיקות יחידות נלוות. הם נוצרו במטרה להיות טריים (לא דלפו בזמן היצירה) וקשים יותר ממערכי נתונים דומים (למשל, HumanEval ו-MBPP). זה יכול לשמש כתחליף או העשרה של מערכי נתונים אלה, שכן הם בנויים בצורה שווה.

FeaturesDict({
    'categories': Sequence(Text(shape=(), dtype=string)),
    'completion': Text(shape=(), dtype=string),
    'instruction': Text(shape=(), dtype=string),
    'language': Text(shape=(), dtype=string),
    'signature': Text(shape=(), dtype=string),
    'task_id': Text(shape=(), dtype=string),
    'test_file': Text(shape=(), dtype=string),
    'test_list': Sequence(Text(shape=(), dtype=string)),
    'test_setup': Text(shape=(), dtype=string),
    'title': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מַחלָקָה צוּרָה Dtype תֵאוּר
FeaturesDict
קטגוריות רצף (טקסט) (אַף לֹא אֶחָד,) חוּט
סִיוּם טֶקסט חוּט
הוֹרָאָה טֶקסט חוּט
שָׂפָה טֶקסט חוּט
חֲתִימָה טֶקסט חוּט
מזהה_משימה טֶקסט חוּט
test_file טֶקסט חוּט
test_list רצף (טקסט) (אַף לֹא אֶחָד,) חוּט
test_setup טֶקסט חוּט
כּוֹתֶרֶת טֶקסט חוּט
@inproceedings{matton-etal-2024-leakage,
    title = "On Leakage of Code Generation Evaluation Datasets",
    author = "Matton, Alexandre  and
      Sherborne, Tom  and
      Aumiller, Dennis  and
      Tommasone, Elena  and
      Alizadeh, Milad  and
      He, Jingyi  and
      Ma, Raymond  and
      Voisin, Maxime  and
      Gilsenan-McMahon, Ellen  and
      Gall{\'e}, Matthias",
    editor = "Al-Onaizan, Yaser  and
      Bansal, Mohit  and
      Chen, Yun-Nung",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2024",
    month = nov,
    year = "2024",
    address = "Miami, Florida, USA",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2024.findings-emnlp.772/",
    doi = "10.18653/v1/2024.findings-emnlp.772",
    pages = "13215--13223",
}

lbpp/all (תצורת ברירת המחדל)

  • תיאור תצורה : LBPP רב לשוני

  • גודל הורדה : 1.78 MiB

  • גודל מערך נתונים : 4.30 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 944

lbpp/רב לשוני

  • תיאור תצורה : LBPP רב לשוני

  • גודל הורדה : 1.78 MiB

  • גודל מערך נתונים : 4.30 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 944

lbpp/default

  • תיאור תצורה : Python LBPP

  • גודל הורדה : 279.90 KiB

  • גודל מערך נתונים : 627.04 KiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 162

lbpp/python

  • תיאור תצורה : Python LBPP

  • גודל הורדה : 279.90 KiB

  • גודל מערך נתונים : 627.04 KiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 162

lbpp/cpp

  • תיאור תצורה : C++ LBPP

  • גודל הורדה : 314.45 KiB

  • גודל מערך נתונים : 761.87 KiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 161

lbpp/go

  • תיאור תצורה : עבור ל-LBPP

  • גודל הורדה : 317.09 KiB

  • גודל מערך נתונים : 687.23 KiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 161

lbpp/java

  • תיאור תצורה : Java LBPP

  • גודל הורדה : 337.90 KiB

  • גודל ערכת נתונים : 887.40 KiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 158

lbpp/js

  • תיאור תצורה : JavaScript LBPP

  • גודל הורדה : 303.40 KiB

  • גודל מערך נתונים : 756.69 KiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 153

lbpp/javascript

  • תיאור תצורה : JavaScript LBPP

  • גודל הורדה : 303.40 KiB

  • גודל מערך נתונים : 756.69 KiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 153

lbpp/חלודה

  • תיאור תצורה : JavaScript LBPP

  • גודל הורדה : 272.61 KiB

  • גודל מערך נתונים : 684.31 KiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 149