ช่วยปกป้อง Great Barrier Reef กับ TensorFlow บน Kaggle เข้าร่วมท้าทาย

schema_guided_dialog

  • รายละเอียด:

ชุดข้อมูล Schema-Guided Dialogue (SGD) ประกอบด้วยการสนทนาแบบหลายโดเมนที่มีคำอธิบายประกอบมากกว่า 20,000 รายการระหว่างมนุษย์กับผู้ช่วยเสมือน การสนทนาเหล่านี้เกี่ยวข้องกับการโต้ตอบกับบริการและ API ที่ครอบคลุม 20 โดเมน ตั้งแต่ธนาคารและกิจกรรมไปจนถึงสื่อ ปฏิทิน การเดินทาง และสภาพอากาศ สำหรับโดเมนเหล่านี้ส่วนใหญ่ ชุดข้อมูลประกอบด้วย API ที่แตกต่างกันหลายรายการ ซึ่งส่วนใหญ่มีฟังก์ชันที่ทับซ้อนกัน แต่มีอินเทอร์เฟซต่างกัน ซึ่งสะท้อนถึงสถานการณ์ทั่วไปในโลกแห่งความเป็นจริง สามารถใช้คำอธิบายประกอบที่หลากหลายสำหรับการคาดคะเนความตั้งใจ การเติมช่อง การติดตามสถานะการสนทนา การเรียนรู้การเลียนแบบนโยบาย การสร้างภาษา การเรียนรู้การจำลองผู้ใช้ รวมถึงงานอื่นๆ ในผู้ช่วยเสมือนขนาดใหญ่ นอกจากนี้ ชุดข้อมูลยังมีโดเมนและบริการที่มองไม่เห็นในชุดการประเมินเพื่อวัดประสิทธิภาพในการตั้งค่าแบบ zero-shot หรือ 2-3 shot

แยก ตัวอย่าง
'dev' 2,482
'test' 4,201
'train' 16,142
  • คุณสมบัติ:
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • อ้างอิง:
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}