profond1b, profond1b

  • Descriptif :

Embeddings pré-formés pour la recherche approximative du voisin le plus proche à l'aide de la distance cosinus. Cet ensemble de données se compose de deux divisions :

  1. 'database' : se compose de 9 990 000 points de données, chacun a des fonctionnalités : 'embedding' (96 flottants), 'index' (int64), 'neighbors' (liste vide).
  2. 'test' : consiste en 10 000 points de données, chacun a des caractéristiques : 'embedding' (96 floats), 'index' (int64), 'neighbors' (liste de 'index' et 'distance' des voisins les plus proches dans la base de données. )
Diviser Exemples
'database' 9 990 000
'test' 10 000
  • Structure des fonctionnalités :
FeaturesDict({
    'embedding': Tensor(shape=(96,), dtype=float32),
    'index': Scalar(shape=(), dtype=int64),
    'neighbors': Sequence({
        'distance': Scalar(shape=(), dtype=float32),
        'index': Scalar(shape=(), dtype=int64),
    }),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
incorporation Tenseur (96,) float32
indice Scalaire int64 Index dans la scission.
voisins Séquence Les voisins calculés, qui ne sont disponibles que pour le fractionnement de test.
voisins/distance Scalaire float32 Éloignement voisin.
voisins/index Scalaire int64 Indice voisin.
  • Citation :
@inproceedings{babenko2016efficient,
  title={Efficient indexing of billion-scale datasets of deep descriptors},
  author={Babenko, Artem and Lempitsky, Victor},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  pages={2055--2063},
  year={2016}
}