wordnet

  • תיאור :

WordNet הוא מסד נתונים מילוני גדול של אנגלית. שמות עצם, פעלים, תארים ותוארים מקובצים לקבוצות של מילים נרדפות קוגניטיביות (סינסטים), כל אחת מבטאת מושג מובחן. סינסטים מקושרים ביניהם באמצעות יחסים מושגיים-סמנטיים ולקסיקליים.

FeaturesDict({
    'lhs': Text(shape=(), dtype=string),
    'relation': Text(shape=(), dtype=string),
    'rhs': Text(shape=(), dtype=string),
})
  • תיעוד תכונה :
תכונה מעמד צוּרָה Dtype תיאור
FeaturesDict
lhs טֶקסט חוּט
יַחַס טֶקסט חוּט
rhs טֶקסט חוּט

wordnet/WN18 (תצורת ברירת המחדל)

  • תיאור תצורה : נתוני TENSOR WORDNET זה מורכבים מאוסף של שלישיות (synset, relation_type, triplet) שחולצו מ-WordNet 3.0 ( http://wordnet.princeton.edu ). ניתן לראות את מערך הנתונים הזה כטנזור בן 3 מצבים המתאר יחסים משולשים בין סינסטים. ראה https://everest.hds.utc.fr/doku.php?id=en :transe.

  • גודל ערכת נתונים : 11.07 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 5,000
'train' 141,442
'validation' 5,000
  • ציטוט :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}

wordnet/WN18RR

  • תיאור תצורה : זהה ל-WN18 אבל מתקן דליפת בדיקה באמצעות יחסים הפוכים. ראה https://github.com/TimDettmers/ConvE

  • גודל מערך נתונים : 7.02 MiB

  • פיצולים :

לְפַצֵל דוגמאות
'test' 3,134
'train' 86,835
'validation' 3,034
  • ציטוט :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@inproceedings{dettmers2018conve,
    Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
    Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
    Title = {Convolutional 2D Knowledge Graph Embeddings},
    Url = {https://arxiv.org/abs/1707.01476},
    Year = {2018},
        pages  = {1811--1818},
    Month = {February}
}