शब्दतंत्र

  • विवरण :

वर्डनेट अंग्रेजी का एक बड़ा शाब्दिक डेटाबेस है। संज्ञा, क्रिया, विशेषण और क्रियाविशेषण को संज्ञानात्मक समानार्थक शब्द (synsets) के समूह में बांटा गया है, प्रत्येक एक अलग अवधारणा को व्यक्त करता है। Synsets वैचारिक-शब्दार्थ और शाब्दिक संबंधों के माध्यम से आपस में जुड़े हुए हैं।

FeaturesDict({
    'lhs': Text(shape=(), dtype=string),
    'relation': Text(shape=(), dtype=string),
    'rhs': Text(shape=(), dtype=string),
})
  • फ़ीचर दस्तावेज़ीकरण :
विशेषता कक्षा आकार डीटाइप विवरण
विशेषताएं डिक्ट
एलएचएस मूलपाठ डोरी
संबंध मूलपाठ डोरी
आरएचएस मूलपाठ डोरी
  • पर्यवेक्षित कुंजियाँ ( as_supervised doc देखें): None

  • चित्र ( tfds.show_examples ): समर्थित नहीं है।

वर्डनेट/WN18 (डिफ़ॉल्ट कॉन्फ़िगरेशन)

  • विन्यास विवरण : इस वर्डनेट टेन्सर डेटा में वर्डनेट 3.0 ( http://wordnet.princeton.edu ) से निकाले गए ट्रिपलेट्स (सिनसेट, रिलेशन_टाइप, ट्रिपलेट) का संग्रह शामिल है। इस डेटा सेट को एक 3-मोड टेंसर के रूप में देखा जा सकता है जो सिंसेट्स के बीच टर्नरी रिश्तों को दर्शाता है। देखें https://everest.hds.utc.fr/doku.php?id=en :transe।

  • डेटासेट का आकार : 11.07 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 5,000
'train' 141,442
'validation' 5,000
  • उद्धरण :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}

वर्डनेट/WN18RR

  • विन्यास विवरण : WN18 के समान लेकिन व्युत्क्रम संबंधों के माध्यम से परीक्षण रिसाव को ठीक करता है। https://github.com/TimDettmers/ConvE देखें

  • डेटासेट का आकार : 7.02 MiB

  • विभाजन :

विभाजित करना उदाहरण
'test' 3,134
'train' 86,835
'validation' 3,034
  • उद्धरण :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}

@inproceedings{dettmers2018conve,
    Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
    Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
    Title = {Convolutional 2D Knowledge Graph Embeddings},
    Url = {https://arxiv.org/abs/1707.01476},
    Year = {2018},
        pages  = {1811--1818},
    Month = {February}
}