schema_guided_dialog

  • คำอธิบาย :

ชุดข้อมูล Schema-Guided Dialogue (SGD) ประกอบด้วยการสนทนาที่เน้นงานหลายโดเมนที่มีคำอธิบายประกอบมากกว่า 20,000 รายการระหว่างมนุษย์กับผู้ช่วยเสมือน การสนทนาเหล่านี้เกี่ยวข้องกับการโต้ตอบกับบริการและ API ที่ครอบคลุม 20 โดเมน ตั้งแต่ธนาคารและกิจกรรมไปจนถึงสื่อ ปฏิทิน การเดินทาง และสภาพอากาศ สำหรับโดเมนส่วนใหญ่เหล่านี้ ชุดข้อมูลประกอบด้วย API ที่แตกต่างกันหลายตัว ซึ่งหลายตัวมีฟังก์ชันการทำงานที่ทับซ้อนกัน แต่มีอินเทอร์เฟซที่แตกต่างกัน ซึ่งสะท้อนถึงสถานการณ์ทั่วไปในโลกแห่งความเป็นจริง คำอธิบายประกอบที่มีอยู่อย่างหลากหลายสามารถใช้สำหรับการคาดคะเนความตั้งใจ การเติมช่อง การติดตามสถานะการสนทนา การเรียนรู้การเลียนแบบนโยบาย การสร้างภาษา การเรียนรู้การจำลองผู้ใช้ รวมถึงงานอื่นๆ ในผู้ช่วยเสมือนขนาดใหญ่ นอกจากนี้ ชุดข้อมูลยังมีโดเมนและบริการที่มองไม่เห็นในชุดการประเมินเพื่อวัดประสิทธิภาพในการตั้งค่าแบบไม่มีช็อตหรือช็อตน้อย

แยก ตัวอย่าง
'dev' 2,482
'test' 4,201
'train' 16,142
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=string)),
})
  • เอกสารคุณสมบัติ :
คุณสมบัติ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
ลำโพงตัวแรก ป้ายกำกับคลาส int64
ข้อมูลเมตา คุณสมบัติDict
ข้อมูลเมตา/บริการ ลำดับ
ข้อมูลเมตา/บริการ/ชื่อ เทนเซอร์ สตริง
คำพูด ลำดับ (ข้อความ) (ไม่มี,) สตริง
  • การอ้างอิง :
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}