datakostki_dolly

  • Opis :

databricks-dolly-15k to zbiór danych o otwartym kodzie źródłowym, zawierający rekordy postępowania zgodnie z instrukcjami, używany w szkoleniu databricks/dolly-v2-12b, który został wygenerowany przez tysiące pracowników Databricks w kilku kategoriach behawioralnych opisanych w artykule InstructGPT , w tym burzy mózgów, klasyfikacji, Zamknięta kontrola jakości, generowanie, ekstrakcja informacji, otwarta kontrola jakości i podsumowanie.

Ten zbiór danych można wykorzystać w dowolnym celu, zarówno akademickim, jak i komercyjnym, zgodnie z warunkami licencji Creative Commons Uznanie autorstwa-Na tych samych warunkach 3.0 Unported .

Podział Przykłady
'train' 15014
  • Struktura funkcji :
FeaturesDict({
    'category': Text(shape=(), dtype=string),
    'context': Text(shape=(), dtype=string),
    'instruction': Text(shape=(), dtype=string),
    'response': Text(shape=(), dtype=string),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDykt
Kategoria Tekst strunowy
kontekst Tekst strunowy
instrukcja Tekst strunowy
odpowiedź Tekst strunowy
  • Cytat :