Korpus Multi-Genre Natural Language Inference (MultiNLI) to zbiór 433 000 par zdań z adnotacjami zawierającymi tekstowe implikacje. Korpus jest wzorowany na korpusie SNLI, ale różni się tym, że obejmuje szereg gatunków tekstu mówionego i pisanego oraz obsługuje charakterystyczną ocenę uogólnienia międzygatunkowego. Korpus posłużył jako podstawa do wspólnego zadania warsztatu RepEval 2017 w EMNLP w Kopenhadze.

Rozdzielać Przykłady
'train' 392702
'validation_matched' 9815
'validation_mismatched' 9832
  • Struktura funkcji :
    'hypothesis': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=3),
    'premise': Text(shape=(), dtype=string),
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
hipoteza Tekst strunowy
etykieta Etykieta klasy int64
przesłanka Tekst strunowy
