- توضیحات :
WordNet یک پایگاه داده بزرگ لغوی انگلیسی است. اسامی ، افعال ، صفت ها و قیدها در مجموعه مترادف شناختی (مجموعه ها) دسته بندی می شوند ، هر یک مفهوم متمایزی را بیان می کنند. مجموعه های ارتباطی با استفاده از روابط مفهومی - معنایی و واژگانی به هم پیوند می خورند.
صفحه اصلی : https://wordnet.princeton.edu/
کد منبع :
tfds.text.Wordnet
نسخه ها :
-
0.1.0
(پیش فرض): بدون یادداشت انتشار.
-
اندازه بارگیری :
3.99 MiB
ذخیره خودکار ( مستندات ): بله
ویژگی ها :
FeaturesDict({
'lhs': Text(shape=(), dtype=tf.string),
'relation': Text(shape=(), dtype=tf.string),
'rhs': Text(shape=(), dtype=tf.string),
})
کلیدهای تحت نظارت (به
as_supervised
سند نظارت شده مراجعه کنید):None
شکل ( tfds.show_examples ): پشتیبانی نمی شود.
wordnet / WN18 (پیکربندی پیش فرض)
توضیحات پیکربندی : این داده های WORDNET TENSOR شامل مجموعه ای از سه گانه (synset ، رابطه_ نوع ، سه گانه) استخراج شده از WordNet 3.0 ( http://wordnet.princeton.edu ) است. این مجموعه داده را می توان به عنوان یک سنسور 3 حالته مشاهده کرد که روابط سه گانه بین مجموعه های برنامه را نشان می دهد. به https://everest.hds.utc.fr/doku.php؟id=en : transe مراجعه کنید .
اندازه مجموعه داده :
11.07 MiB
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 5000 |
'train' | 141،442 |
'validation' | 5000 |
- نقل قول :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@incollection{NIPS2013_5071,
title = {Translating Embeddings for Modeling Multi-relational Data},
author = {Bordes, Antoine and Usunier, Nicolas and Garcia-Duran, Alberto and Weston, Jason and Yakhnenko, Oksana},
booktitle = {Advances in Neural Information Processing Systems 26},
editor = {C. J. C. Burges and L. Bottou and M. Welling and Z. Ghahramani and K. Q. Weinberger},
pages = {2787--2795},
year = {2013},
publisher = {Curran Associates, Inc.},
url = {http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf}
}
- مثالها ( tfds.as_dataframe ):
wordnet / WN18RR
شرح پیکربندی : همان WN18 است اما نشتی آزمایش را از طریق روابط معکوس برطرف می کند. به https://github.com/TimDettmers/ConvE مراجعه کنید
اندازه مجموعه داده :
7.02 MiB
تقسیم :
شکاف | مثال ها |
---|---|
'test' | 3،134 |
'train' | 86،835 |
'validation' | 3،034 |
- نقل قول :
@article{10.1145/219717.219748,
author = {Miller, George A.},
title = {WordNet: A Lexical Database for English},
year = {1995},
issue_date = {Nov. 1995},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {38},
number = {11},
issn = {0001-0782},
url = {https://doi.org/10.1145/219717.219748},
doi = {10.1145/219717.219748},
journal = {Commun. ACM},
month = nov,
pages = {39--41},
numpages = {3}
}
@inproceedings{dettmers2018conve,
Author = {Dettmers, Tim and Pasquale, Minervini and Pontus, Stenetorp and Riedel, Sebastian},
Booktitle = {Proceedings of the 32th AAAI Conference on Artificial Intelligence},
Title = {Convolutional 2D Knowledge Graph Embeddings},
Url = {https://arxiv.org/abs/1707.01476},
Year = {2018},
pages = {1811--1818},
Month = {February}
}
- مثالها ( tfds.as_dataframe ):