Pomoc chronić Wielkiej Rafy Koralowej z TensorFlow na Kaggle Dołącz Wyzwanie

schema_guided_dialog

  • opis:

Zestaw danych Schema-Guided Dialogue (SGD) składa się z ponad 20 tys. adnotowanych wielodomenowych, zorientowanych na zadania konwersacji między człowiekiem a wirtualnym asystentem. Rozmowy te obejmują interakcje z usługami i interfejsami API obejmującymi 20 domen, od banków i wydarzeń po media, kalendarz, podróże i pogodę. W przypadku większości tych domen zestaw danych zawiera wiele różnych interfejsów API, z których wiele ma nakładające się funkcje, ale różne interfejsy, co odzwierciedla typowe scenariusze w świecie rzeczywistym. Szeroki zakres dostępnych adnotacji można wykorzystać do przewidywania zamiarów, wypełniania przedziałów, śledzenia stanu dialogów, uczenia się naśladowania zasad, generowania języka, uczenia się symulacji użytkownika, a także innych zadań w wirtualnych asystentach na dużą skalę. Poza tym zestaw danych zawiera niewidoczne domeny i usługi w zestawie ewaluacyjnym, aby określić ilościowo wydajność w ustawieniach zerowych lub kilku strzałów.

Podział Przykłady
'dev' 2482
'test' 4201
'train' 16 142
  • Cechy:
FeaturesDict({
    'first_speaker': ClassLabel(shape=(), dtype=tf.int64, num_classes=2),
    'metadata': FeaturesDict({
        'services': Sequence({
            'name': tf.string,
        }),
    }),
    'utterances': Sequence(Text(shape=(), dtype=tf.string)),
})
  • cytat:
@article{rastogi2019towards,
  title={Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset},
  author={Rastogi, Abhinav and Zang, Xiaoxue and Sunkara, Srinivas and Gupta, Raghav and Khaitan, Pranav},
  journal={arXiv preprint arXiv:1909.05855},
  year={2019}
}