دستورات_غیر طبیعی

  • توضیحات :

مجموعه داده شرح داده شده در مقاله: دستورالعمل های غیر طبیعی: مدل های زبان تنظیم با (تقریباً) بدون کار انسانی (2022). شامل مجموعه‌ای از دستورالعمل‌های زبان طبیعی، با محدودیت‌های اختیاری / فرمول‌بندی‌های مجدد ایجاد شده توسط LLM.

  • صفحه اصلی : https://github.com/orhonovich/unnatural-instructions

  • کد منبع : tfds.text.unnatural_instructions.UnnaturalInstructions

  • نسخه ها :

    • 0.0.1 (پیش فرض): انتشار اولیه. دستورالعمل ها / ورودی ها را حذف کنید، زیرا آنها نیاز به پردازش اضافی دارند. Instruction_with_inputs و reformulation ها حاوی دستورالعمل ها و زمینه ها هستند.
  • حجم دانلود : 17.48 MiB

  • حجم مجموعه داده : 154.71 MiB

  • ذخیره خودکار ( مستندات ): فقط زمانی که shuffle_files=False (قطار)

  • تقسیم ها :

شکاف مثال ها
'train' 66010
  • ساختار ویژگی :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'instances': Sequence({
        'constraints': Text(shape=(), dtype=string),
        'input': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
    'instruction': Text(shape=(), dtype=string),
    'reformulations': Sequence({
        'input': Text(shape=(), dtype=string),
        'instruction': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
})
  • مستندات ویژگی :
ویژگی کلاس شکل نوع D شرح
FeaturesDict
شناسه متن رشته به عنوان مثال شناسه منحصر به فرد.
نمونه ها توالی
موارد/محدودیت ها متن رشته محدودیت های خاص وظیفه
نمونه ها / ورودی متن رشته ورودی باید برای دستورالعمل داده شده به متغیرهایی وارد شود.
instances/instruction_with_input متن رشته دستورالعمل‌هایی با ورودی‌های ارائه شده به جای‌بان‌ها.
نمونه ها/خروجی ها متن رشته خروجی هدف برای کار داده شده
دستورالعمل متن رشته دستورالعمل با متغیرهایی برای ورودی ها.
فرمول بندی مجدد توالی
فرمول بندی مجدد / ورودی متن رشته ورودی باید برای دستورالعمل داده شده به متغیرهایی وارد شود.
فرمول بندی مجدد/دستورالعمل متن رشته دستورالعمل با متغیرهایی برای ورودی ها.
فرمول بندی مجدد/دستورالعمل_با_ورودی متن رشته دستورالعمل‌هایی با ورودی‌های ارائه شده به جای‌بان‌ها.
فرمول بندی مجدد / خروجی متن رشته خروجی هدف برای کار داده شده
  • نقل قول :
@misc{honovich2022unnatural,
      title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
      author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
      url = {https://arxiv.org/abs/2212.09689},
      publisher = {arXiv},
      year={2022}
}