unnatural_instructions

  • คำอธิบาย :

ชุดข้อมูลที่อธิบายไว้ในบทความ: Unnatural Instructions: Tuning Language Models with (เกือบ) No Human Labour (2022) ประกอบด้วยชุดคำสั่งภาษาธรรมชาติ พร้อมข้อจำกัดทางเลือก / การปรับโครงสร้างที่ LLM สร้างขึ้น

  • หน้าแรก : https://github.com/orhonovich/unnatural-instructions

  • รหัสแหล่งที่มา : tfds.text.unnatural_instructions.UnnaturalInstructions

  • รุ่น :

    • 0.0.1 (ค่าเริ่มต้น): การเปิดตัวครั้งแรก ละเว้นคำสั่ง / อินพุต เนื่องจากต้องใช้การประมวลผลเพิ่มเติม Instruction_with_inputs และ reformulations ประกอบด้วยคำสั่งและบริบท
  • ขนาดการดาวน์โหลด : 17.48 MiB

  • ขนาดชุดข้อมูล : 154.71 MiB

  • แคชอัตโนมัติ ( เอกสาร ): เฉพาะเมื่อ shuffle_files=False (รถไฟ)

  • แยก :

แยก ตัวอย่าง
'train' 66,010
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'id': Text(shape=(), dtype=string),
    'instances': Sequence({
        'constraints': Text(shape=(), dtype=string),
        'input': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
    'instruction': Text(shape=(), dtype=string),
    'reformulations': Sequence({
        'input': Text(shape=(), dtype=string),
        'instruction': Text(shape=(), dtype=string),
        'instruction_with_input': Text(shape=(), dtype=string),
        'output': Text(shape=(), dtype=string),
    }),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
รหัส ข้อความ สตริง ตัวระบุที่ไม่ซ้ำ ตัวอย่างเช่น
ตัวอย่าง ลำดับ
กรณี / ข้อจำกัด ข้อความ สตริง ข้อจำกัดเฉพาะงาน
อินสแตนซ์ / อินพุต ข้อความ สตริง ข้อมูลที่จะป้อนลงในตัวยึดตำแหน่งสำหรับคำแนะนำที่กำหนด
อินสแตนซ์/instruction_with_input ข้อความ สตริง คำแนะนำพร้อมอินพุตที่จัดเตรียมให้กับตัวยึดตำแหน่ง
อินสแตนซ์ / เอาต์พุต ข้อความ สตริง เอาต์พุตเป้าหมายสำหรับงานที่กำหนด
คำแนะนำ ข้อความ สตริง คำแนะนำพร้อมตัวยึดสำหรับอินพุต
การปฏิรูป ลำดับ
การปฏิรูป/การป้อนข้อมูล ข้อความ สตริง ข้อมูลที่จะป้อนลงในตัวยึดตำแหน่งสำหรับคำแนะนำที่กำหนด
การปฏิรูป / คำแนะนำ ข้อความ สตริง คำแนะนำพร้อมตัวยึดสำหรับอินพุต
การปฏิรูป/instruction_with_input ข้อความ สตริง คำแนะนำพร้อมอินพุตที่จัดเตรียมให้กับตัวยึดตำแหน่ง
การปฏิรูป/ผลลัพธ์ ข้อความ สตริง เอาต์พุตเป้าหมายสำหรับงานที่กำหนด
  • การอ้างอิง :
@misc{honovich2022unnatural,
      title = {Unnatural Instructions: Tuning Language Models with (Almost) No Human Labor},
      author = {Honovich, Or and Scialom, Thomas and Levy, Omer and Schick, Timo},
      url = {https://arxiv.org/abs/2212.09689},
      publisher = {arXiv},
      year={2022}
}