q_re_cc

  • opis :

Zbiór danych zawierający 14 000 rozmów z 81 000 par pytanie-odpowiedź. QReCC opiera się na pytaniach TREC CAsT, QuAC i Google Natural Questions.

Podział Przykłady
'test' 16451
'train' 63501
  • Struktura funkcji :
FeaturesDict({
    'answer': Text(shape=(), dtype=string),
    'answer_url': Text(shape=(), dtype=string),
    'context': Sequence(Text(shape=(), dtype=string)),
    'conversation_id': Scalar(shape=(), dtype=int32),
    'question': Text(shape=(), dtype=string),
    'question_rewrite': Text(shape=(), dtype=string),
    'source': Text(shape=(), dtype=string),
    'turn_id': Scalar(shape=(), dtype=int32),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształtować się Typ D Opis
FunkcjeDict
odpowiadać Tekst strunowy
adres_odpowiedzi Tekst strunowy
kontekst Sekwencja (tekst) (Nic,) strunowy
identyfikator_rozmowy Skalarny int32 Identyfikator konwersacji.
pytanie Tekst strunowy
pytanie_przepisz Tekst strunowy
źródło Tekst strunowy Pierwotne źródło danych — QuAC, CAsT lub Natural Questions
identyfikator_zwrotu Skalarny int32 Identyfikator konwersacji z kolei w konwersacji.
  • Cytat :
@article{qrecc,
  title={Open-Domain Question Answering Goes Conversational via Question Rewriting},
  author={Anantha, Raviteja and Vakulenko, Svitlana and Tu, Zhucheng and Longpre, Shayne and Pulman, Stephen and Chappidi, Srinivas},
  journal={Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies},
  year={2021}
}