rękawiczka100_kątowa

  • opis :

Wstępnie wytrenowane wektory globalne do osadzania reprezentacji programu Word (GloVe) w celu przybliżonego wyszukiwania najbliższego sąsiada. Ten zestaw danych składa się z dwóch podziałów:

  1. „baza danych”: składa się z 1 183 514 punktów danych, z których każdy ma funkcje: „osadzanie” (100 elementów zmiennoprzecinkowych), „indeks” (int64), „sąsiedzi” (pusta lista).
  2. „test”: składa się z 10 000 punktów danych, z których każdy ma cechy: „osadzanie” (100 pływaków), „indeks” (int64), „sąsiedzi” (lista „indeksu” i „odległości” najbliższych sąsiadów w bazie danych. )
Rozdzielać Przykłady
'database' 1183514
'test' 10 000
  • Struktura funkcji :
FeaturesDict({
    'embedding': Tensor(shape=(100,), dtype=float32),
    'index': Scalar(shape=(), dtype=int64),
    'neighbors': Sequence({
        'distance': Scalar(shape=(), dtype=float32),
        'index': Scalar(shape=(), dtype=int64),
    }),
})
  • Dokumentacja funkcji :
Funkcja Klasa Kształt Typ D Opis
FunkcjeDict
osadzanie Napinacz (100,) pływak32
indeks Skalarny int64 Indeks w podziale.
sąsiedzi Sekwencja Obliczeni sąsiedzi, który jest dostępny tylko dla podziału testu.
sąsiedzi/odległość Skalarny pływak32 Odległość sąsiedzka.
sąsiedzi/indeks Skalarny int64 Indeks sąsiadów.
  • Cytat :
@inproceedings{pennington2014glove,
  author = {Jeffrey Pennington and Richard Socher and Christopher D. Manning},
  booktitle = {Empirical Methods in Natural Language Processing (EMNLP)},
  title = {GloVe: Global Vectors for Word Representation},
  year = {2014},
  pages = {1532--1543},
  url = {http://www.aclweb.org/anthology/D14-1162},
}