wordnet

  • Descriptif :

WordNet est une grande base de données lexicale de l'anglais. Les noms, verbes, adjectifs et adverbes sont regroupés en ensembles de synonymes cognitifs (synsets), chacun exprimant un concept distinct. Les synsets sont interconnectés au moyen de relations conceptuelles-sémantiques et lexicales.

FeaturesDict({
    'lhs': Text(shape=(), dtype=string),
    'relation': Text(shape=(), dtype=string),
    'rhs': Text(shape=(), dtype=string),
})
  • Documentation des fonctionnalités :
Caractéristique Classer Forme Dtype La description
FonctionnalitésDict
gauche Texte chaîne de caractères
relation Texte chaîne de caractères
droite Texte chaîne de caractères

wordnet/WN18 (configuration par défaut)

  • Description de la configuration : Ce WORDNET TENSOR DATA consiste en une collection de triplets (synset, relation_type, triplet) extraits de WordNet 3.0 ( http://wordnet.princeton.edu ). Cet ensemble de données peut être vu comme un tenseur à 3 modes décrivant les relations ternaires entre les synsets. Voir https://everest.hds.utc.fr/doku.php?id=en :transe.

  • Taille du jeu de données : 11.07 MiB

  • Fractionnements :

Diviser Exemples
'test' 5 000
'train' 141 442
'validation' 5 000
  • Citation :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}

wordnet/WN18RR

  • Description de la configuration : Identique à WN18 mais corrige les fuites de test via des relations inverses. Voir https://github.com/TimDettmers/ConvE

  • Taille du jeu de données : 7.02 MiB

  • Fractionnements :

Diviser Exemples
'test' 3 134
'train' 86 835
'validation' 3 034
  • Citation :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@inproceedings{dettmers2018conve,
    Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
    Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
    Title = {Convolutional 2D Knowledge Graph Embeddings},
    Url = {https://arxiv.org/abs/1707.01476},
    Year = {2018},
        pages  = {1811--1818},
    Month = {February}
}