- Описание :
Набор данных Википедии, содержащий очищенные статьи на всех языках. Наборы данных созданы из дампа Википедии ( https://dumps.wikimedia.org/ ) с одним разбиением на каждый язык. Каждый пример содержит содержимое одной полной статьи Википедии с очисткой от уценки и ненужных разделов (ссылки и т. д.).
Домашняя страница : https://dumps.wikimedia.org
Исходный код :
tfds.text.Wikipedia
Версии :
-
1.0.0
(по умолчанию): новый раздельный API ( https://tensorflow.org/datasets/splits )
-
Структура функции :
FeaturesDict({
'text': Text(shape=(), dtype=tf.string),
'title': Text(shape=(), dtype=tf.string),
})
- Документация по функциям :
Особенность | Учебный класс | Форма | Dтип | Описание |
---|---|---|---|---|
ОсобенностиDict | ||||
текст | Текст | tf.string | ||
заглавие | Текст | tf.string |
Ключи под наблюдением (см . документ
as_supervised
):None
Рисунок ( tfds.show_examples ): не поддерживается.
Цитата :
@ONLINE {wikidump,
author = "Wikimedia Foundation",
title = "Wikimedia Downloads",
url = "https://dumps.wikimedia.org"
}
wikipedia/20201201.aa (конфигурация по умолчанию)
Описание конфигурации : набор данных Википедии для aa, проанализированный из дампа 20201201.
Размер загрузки :
45.29 KiB
Размер набора данных :
3.46 KiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ab
Описание конфигурации : набор данных Википедии для ab, проанализированный из дампа 20201201.
Размер загрузки :
1.80 MiB
Размер набора данных :
2.86 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 7136 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ace
Описание конфигурации : набор данных Википедии для ace, проанализированный из дампа 20201201.
Размер загрузки :
3.17 MiB
Размер набора данных :
3.73 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 11 561 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.ady
Описание конфигурации : набор данных Википедии для ady, проанализированный из дампа 20201201.
Размер загрузки :
457.46 KiB
Размер набора данных :
515.14 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 562 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.af
Описание конфигурации : набор данных Википедии для af, проанализированный из дампа 20201201.
Размер загрузки :
111.81 MiB
Размер набора данных :
192.73 MiB
.Автокэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплиты :
Расколоть | Примеры |
---|---|
'train' | 117 154 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ak
Описание конфигурации : набор данных Википедии для ak, проанализированный из дампа 20201201.
Размер загрузки :
680.35 KiB
Размер набора данных :
732.95 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1424 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.als
Описание конфигурации : набор данных Википедии для als, проанализированный из дампа 20201201.
Размер загрузки :
52.48 MiB
Размер набора данных :
70.04 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 29 826 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.am
Описание конфигурации : набор данных Википедии для am, проанализированный из дампа 20201201.
Размер загрузки :
7.12 MiB
Размер набора данных :
17.44 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 13 502 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ан
Описание конфигурации : набор данных Википедии для файла, проанализированный из дампа 20201201.
Размер загрузки :
34.56 MiB
Размер набора данных :
48.50 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 53 071 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ang
Описание конфигурации : набор данных Википедии для ang, проанализированный из дампа 20201201.
Размер загрузки :
4.32 MiB
Размер набора данных :
2.46 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3360 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ар
Описание конфигурации : набор данных Википедии для ar, проанализированный из дампа 20201201.
Размер загрузки :
1.22 GiB
Размер набора данных :
2.32 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 2 049 549 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.arc
Описание конфигурации : набор данных Википедии для дуги, проанализированный из дампа 20201201.
Размер загрузки :
1.09 MiB
Размер набора данных :
851.19 KiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3534 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.arz
Описание конфигурации : набор данных Википедии для arz, проанализированный из дампа 20201201.
Размер загрузки :
153.51 MiB
Размер набора данных :
851.84 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1 182 669 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.as
Описание конфигурации : набор данных Википедии для as, проанализированный из дампа 20201201.
Размер загрузки :
24.77 MiB
.Размер набора данных :
48.62 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 7643 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ast
Описание конфигурации : набор данных Википедии для ast, проанализированный из дампа 20201201.
Размер загрузки :
218.95 MiB
Размер набора данных :
447.75 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 116 833 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.atj
Описание конфигурации : набор данных Википедии для atj, проанализированный из дампа 20201201.
Размер загрузки :
602.22 KiB
Размер набора данных :
756.58 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1424 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.av
Описание конфигурации : набор данных Википедии для av, проанализированный из дампа 20201201.
Размер загрузки :
5.27 MiB
Размер набора данных :
3.54 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3173 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.ay
Описание конфигурации : набор данных Википедии для ау, проанализированный из дампа 20201201.
Размер загрузки :
2.26 MiB
Размер набора данных :
4.14 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 5253 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.az
Описание конфигурации : набор данных Википедии для az, проанализированный из дампа 20201201.
Размер загрузки :
200.75 MiB
.Размер набора данных :
344.59 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 203 051 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.azb
Описание конфигурации : набор данных Википедии для azb, проанализированный из дампа 20201201.
Размер загрузки :
91.79 MiB
.Размер набора данных :
156.66 MiB
.Автокэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплиты :
Расколоть | Примеры |
---|---|
'train' | 265 450 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ba
Описание конфигурации : набор данных Википедии для ba, проанализированный из дампа 20201201.
Размер загрузки :
72.92 MiB
Размер набора данных :
207.55 MiB
.Автокэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплиты :
Расколоть | Примеры |
---|---|
'train' | 61 290 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.бар
Описание конфигурации : набор данных Википедии для бара, проанализированный из дампа 20201201.
Размер загрузки :
33.42 MiB
.Размер набора данных :
41.25 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 46 935 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.bat-smg
Описание конфигурации : набор данных Википедии для bat-smg, проанализированный из дампа 20201201.
Размер загрузки :
4.91 MiB
Размер набора данных :
6.68 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 19 779 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bcl
Описание конфигурации : набор данных Википедии для bcl, проанализированный из дампа 20201201.
Размер загрузки :
10.22 MiB
Размер набора данных :
10.45 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 10 763 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.be
Описание конфигурации : набор данных Википедии для be, проанализированный из дампа 20201201.
Размер загрузки :
224.26 MiB
Размер набора данных :
465.50 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 198 957 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.be-x-old
Описание конфигурации : набор данных Википедии для be-x-old, проанализированный из дампа 20201201.
Размер загрузки :
84.30 MiB
Размер набора данных :
187.21 MiB
.Автокэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплиты :
Расколоть | Примеры |
---|---|
'train' | 103 888 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bg
Описание конфигурации : набор данных Википедии для bg, проанализированный из дампа 20201201.
Размер загрузки :
362.31 MiB
Размер набора данных :
909.59 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 387 980 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bh
Описание конфигурации : набор данных Википедии для bh, проанализированный из дампа 20201201.
Размер загрузки :
14.57 MiB
.Размер набора данных :
11.10 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 7395 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bi
Описание конфигурации : набор данных Википедии для bi, проанализированный из дампа 20201201.
Размер загрузки :
461.56 KiB
Размер набора данных :
306.05 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1406 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bjn
Описание конфигурации : набор данных Википедии для bjn, проанализированный из дампа 20201201.
Размер загрузки :
3.44 MiB
Размер набора данных :
3.20 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3790 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bm
Описание конфигурации : набор данных Википедии для bm, проанализированный из дампа 20201201.
Размер загрузки :
602.51 KiB
Размер набора данных :
353.23 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 754 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bn
Описание конфигурации : набор данных Википедии для bn, проанализированный из дампа 20201201.
Размер загрузки :
223.59 MiB
Размер набора данных :
594.36 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 156 991 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bo
Описание конфигурации : набор данных Википедии для bo, проанализированный из дампа 20201201.
Размер загрузки :
13.32 MiB
Размер набора данных :
117.09 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 11 670 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.bpy
Описание конфигурации : набор данных Википедии для bpy, проанализированный из дампа 20201201.
Размер загрузки :
5.23 MiB
Размер набора данных :
39.40 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 25 475 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.br
Описание конфигурации : набор данных Википедии для br, проанализированный из дампа 20201201.
Размер загрузки :
52.28 MiB
.Размер набора данных :
74.03 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 79 725 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.bs
Описание конфигурации : набор данных Википедии для bs, проанализированный из дампа 20201201.
Размер загрузки :
117.25 MiB
Размер набора данных :
159.74 MiB
.Автокэширование ( документация ): только когда
shuffle_files=False
(поезд)Сплиты :
Расколоть | Примеры |
---|---|
'train' | 190 059 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.ошибка
Описание конфигурации : набор данных Википедии для ошибки, проанализированный из дампа 20201201.
Размер загрузки :
1.84 MiB
Размер набора данных :
2.73 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 14 424 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.bxr
Описание конфигурации : набор данных Википедии для bxr, проанализированный из дампа 20201201.
Размер загрузки :
3.29 MiB
Размер набора данных :
5.68 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 2665 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ca
Описание конфигурации : набор данных Википедии для ca, проанализированный из дампа 20201201.
Размер загрузки :
947.73 MiB
Размер набора данных :
1.57 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 740 415 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.cbk-zam
Описание конфигурации : набор данных Википедии для cbk-zam, проанализированный из дампа 20201201.
Размер загрузки :
3.37 MiB
Размер набора данных :
3.23 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 4479 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.cdo
Описание конфигурации : набор данных Википедии для cdo, проанализированный из дампа 20201201.
Размер загрузки :
4.46 MiB
Размер набора данных :
4.03 MiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 16 879 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ce
Описание конфигурации : набор данных Википедии для ce, проанализированный из дампа 20201201.
Размер загрузки :
60.74 MiB
.Размер набора данных :
323.18 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 349 688 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ceb
Описание конфигурации : набор данных Википедии для ceb, проанализированный из дампа 20201201.
Размер загрузки :
1.87 GiB
Размер набора данных :
3.69 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 5 377 442 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.ch
Описание конфигурации : набор данных Википедии для ch, проанализированный из дампа 20201201.
Размер загрузки :
723.85 KiB
Размер набора данных :
168.11 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 544 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.чо
Описание конфигурации : набор данных Википедии для cho, проанализированный из дампа 20201201.
Размер загрузки :
27.02 KiB
Размер набора данных :
7.44 KiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 14 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.chr
Описание конфигурации : набор данных Википедии для chr, проанализированный из дампа 20201201.
Размер загрузки :
659.67 KiB
Размер набора данных :
641.72 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 969 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.chy
Описание конфигурации : набор данных Википедии для chy, проанализированный из дампа 20201201.
Размер загрузки :
353.22 KiB
Размер набора данных :
116.82 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 783 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ckb
Описание конфигурации : набор данных Википедии для ckb, проанализированный из дампа 20201201.
Размер загрузки :
31.97 MiB
Размер набора данных :
55.92 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 30 058 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.co
Описание конфигурации : набор данных Википедии для co, проанализированный из дампа 20201201.
Размер загрузки :
4.56 MiB
Размер набора данных :
6.14 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 6617 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.cr
Описание конфигурации : набор данных Википедии для cr, проанализированный из дампа 20201201.
Размер загрузки :
287.29 KiB
Размер набора данных :
65.23 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 135 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.crh
Описание конфигурации : набор данных Википедии для crh, проанализированный из дампа 20201201.
Размер загрузки :
4.79 MiB
Размер набора данных :
3.06 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 8 237 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.cs
Описание конфигурации : набор данных Википедии для cs, проанализированный из дампа 20201201.
Размер загрузки :
882.62 MiB
Размер набора данных :
1.22 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 603 353 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.csb
Описание конфигурации : набор данных Википедии для csb, проанализированный из дампа 20201201.
Размер загрузки :
2.19 MiB
Размер набора данных :
3.40 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 5727 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.cu
Описание конфигурации : набор данных Википедии для cu, проанализированный из дампа 20201201.
Размер загрузки :
695.33 KiB
Размер набора данных :
706.87 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1592 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.cv
Описание конфигурации : набор данных Википедии для cv, проанализированный из дампа 20201201.
Размер загрузки :
25.37 MiB
Размер набора данных :
63.07 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 48 049 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.cy
Описание конфигурации : набор данных Википедии для cy, проанализированный из дампа 20201201.
Размер загрузки :
78.15 MiB
Размер набора данных :
114.47 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 173 604 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.да
Описание конфигурации : набор данных Википедии для da, проанализированный из дампа 20201201.
Размер загрузки :
356.47 MiB
Размер набора данных :
471.83 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 263 308 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.de
Описание конфигурации : набор данных Википедии для de, проанализированный из дампа 20201201.
Размер загрузки :
5.58 GiB
Размер набора данных :
7.85 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3 229 667 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.дин
Описание конфигурации : набор данных Википедии для din, проанализированный из дампа 20201201.
Размер загрузки :
506.05 KiB
Размер набора данных :
486.08 KiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 303 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.diq
Описание конфигурации : набор данных Википедии для diq, проанализированный из дампа 20201201.
Размер загрузки :
11.05 MiB
Размер набора данных :
16.11 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 42 014 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.dsb
Описание конфигурации : набор данных Википедии для dsb, проанализированный из дампа 20201201.
Размер загрузки :
3.81 MiB
Размер набора данных :
3.13 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3541 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.dty
Описание конфигурации : набор данных Википедии для dty, проанализированный из дампа 20201201.
Размер загрузки :
6.95 MiB
Размер набора данных :
6.03 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3584 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.dv
Описание конфигурации : набор данных Википедии для dv, проанализированный из дампа 20201201.
Размер загрузки :
4.36 MiB
Размер набора данных :
12.42 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 4271 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.dz
Описание конфигурации : набор данных Википедии для dz, проанализированный из дампа 20201201.
Размер загрузки :
386.98 KiB
Размер набора данных :
800.32 KiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 290 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.ee
Описание конфигурации : набор данных Википедии для ee, проанализированный из дампа 20201201.
Размер загрузки :
478.59 KiB
Размер набора данных :
217.86 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 385 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.el
Описание конфигурации : набор данных Википедии для el, проанализированный из дампа 20201201.
Размер загрузки :
390.18 MiB
Размер набора данных :
1008.24 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 259 509 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.eml
Описание конфигурации : набор данных Википедии для eml, проанализированный из дампа 20201201.
Размер загрузки :
8.58 MiB
Размер набора данных :
3.16 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 14 658 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.ru
Описание конфигурации : набор данных Википедии для en, проанализированный из дампа 20201201.
Размер загрузки :
17.70 GiB
Размер набора данных :
17.76 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 6 210 110 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ео
Описание конфигурации : набор данных Википедии для eo, проанализированный из дампа 20201201.
Размер загрузки :
281.09 MiB
Размер набора данных :
427.66 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 398 951 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.es
Описание конфигурации : набор данных Википедии для es, проанализированный из дампа 20201201.
Размер загрузки :
3.38 GiB
Размер набора данных :
4.84 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 2 943 343 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.et
Описание конфигурации : набор данных Википедии для et, проанализированный из дампа 20201201.
Размер загрузки :
223.58 MiB
Размер набора данных :
369.36 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 328 713 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.eu
Описание конфигурации : набор данных Википедии для ЕС, проанализированный из дампа 20201201.
Размер загрузки :
214.93 MiB
Размер набора данных :
417.98 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 463 673 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.ext
Описание конфигурации : набор данных Википедии для расширения, проанализированный из дампа 20201201.
Размер загрузки :
2.55 MiB
Размер набора данных :
3.62 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3536 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.fa
Описание конфигурации : набор данных Википедии для fa, проанализированный из дампа 20201201.
Размер загрузки :
850.45 MiB
Размер набора данных :
1.45 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 2 427 541 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ff
Описание конфигурации : набор данных Википедии для ff, проанализированный из дампа 20201201.
Размер загрузки :
516.43 KiB
Размер набора данных :
524.57 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 364 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.fi
Описание конфигурации : набор данных Википедии для fi, проанализированный из дампа 20201201.
Размер загрузки :
744.51 MiB
Размер набора данных :
964.66 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 682 734 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.fiu-vro
Описание конфигурации : набор данных Википедии для fiu-vro, проанализированный из дампа 20201201.
Размер загрузки :
2.16 MiB
Размер набора данных :
3.46 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 6266 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.fj
Описание конфигурации : набор данных Википедии для fj, проанализированный из дампа 20201201.
Размер загрузки :
781.90 KiB
Размер набора данных :
456.89 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1118 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.fo
Описание конфигурации : набор данных Википедии для fo, проанализированный из дампа 20201201.
Размер загрузки :
14.37 MiB
Размер набора данных :
13.68 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 13 453 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.fr
Описание конфигурации : набор данных Википедии для fr, проанализированный из дампа 20201201.
Размер загрузки :
4.75 GiB
Размер набора данных :
6.34 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 2 274 691 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.frp
Описание конфигурации : набор данных Википедии для frp, проанализированный из дампа 20201201.
Размер загрузки :
2.60 MiB
Размер набора данных :
1.95 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 6125 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.frr
Описание конфигурации : набор данных Википедии для frr, проанализированный из дампа 20201201.
Размер загрузки :
9.78 MiB
Размер набора данных :
6.88 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 13 251 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.мех
Описание конфигурации : набор данных Википедии для меха, проанализированный из дампа 20201201.
Размер загрузки :
2.45 MiB
Размер набора данных :
3.66 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3658 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.fy
Описание конфигурации : набор данных Википедии для fy, проанализированный из дампа 20201201.
Размер загрузки :
53.07 MiB
Размер набора данных :
100.08 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 44 749 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.га
Описание конфигурации : набор данных Википедии для ga, проанализированный из дампа 20201201.
Размер загрузки :
29.73 MiB
.Размер набора данных :
46.66 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 61 009 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.gag
Описание конфигурации : набор данных Википедии для gag, проанализированный из дампа 20201201.
Размер загрузки :
2.07 MiB
Размер набора данных :
2.28 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3021 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.ган
Описание конфигурации : набор данных Википедии для gan, проанализированный из дампа 20201201.
Размер загрузки :
3.91 MiB
Размер набора данных :
2.45 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 6525 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.gd
Описание конфигурации : набор данных Википедии для gd, проанализированный из дампа 20201201.
Размер загрузки :
8.95 MiB
Размер набора данных :
12.58 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 15 270 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.gl
Описание конфигурации : набор данных Википедии для gl, проанализированный из дампа 20201201.
Размер загрузки :
268.72 MiB
Размер набора данных :
397.80 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 226 449 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.glk
Описание конфигурации : набор данных Википедии для glk, проанализированный из дампа 20201201.
Размер загрузки :
2.16 MiB
Размер набора данных :
4.46 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 7001 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.gn
Описание конфигурации : набор данных Википедии для gn, проанализированный из дампа 20201201.
Размер загрузки :
3.81 MiB
Размер набора данных :
5.47 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 4887 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.gom
Описание конфигурации : набор данных Википедии для gom, проанализированный из дампа 20201201.
Размер загрузки :
6.70 MiB
Размер набора данных :
29.64 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 4482 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.гор
Описание конфигурации : набор данных Википедии для gor, проанализированный из дампа 20201201.
Размер загрузки :
3.02 MiB
Размер набора данных :
4.37 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 11 335 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.гот
Описание конфигурации : набор данных Википедии для got, проанализированный из дампа 20201201.
Размер загрузки :
699.97 KiB
Размер набора данных :
1.32 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 955 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.гу
Описание конфига: набор данных Википедии для гу, проанализированный из дампа 20201201.
Размер загрузки :
29.64 MiB
Размер набора данных :
108.56 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 29 449 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.gv
Описание конфигурации : набор данных Википедии для gv, проанализированный из дампа 20201201.
Размер загрузки :
5.47 MiB
Размер набора данных :
4.40 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 5036 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.га
Описание конфигурации : набор данных Википедии для ha, проанализированный из дампа 20201201.
Размер загрузки :
5.19 MiB
Размер набора данных :
7.80 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 7017 |
- Примеры ( tfds.as_dataframe ):
wikipedia/20201201.hak
Описание конфигурации : набор данных Википедии для хака, проанализированный из дампа 20201201.
Размер загрузки :
3.84 MiB
Размер набора данных :
4.04 MiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 12 053 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.haw
Описание конфигурации : набор данных Википедии для haw, проанализированный из дампа 20201201.
Размер загрузки :
1.05 MiB
Размер набора данных :
1.26 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 2516 |
- Примеры ( tfds.as_dataframe ):
Википедия/20201201.он
Описание конфигурации : набор данных Википедии для he, проанализированный из дампа 20201201.
Размер загрузки :
690.54 MiB
Размер набора данных :
1.48 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 454 321 |
- Примеры ( tfds.as_dataframe ):
википедия/20201201.привет
Описание конфигурации : набор данных Википедии для hi, проанализированный из дампа 20201201.
Размер загрузки :
166.88 MiB
Размер набора данных :
545.88 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 178 324 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.hif
Описание конфигурации : набор данных Википедии для hif, проанализированный из дампа 20201201.
Размер загрузки :
4.88 MiB
Размер набора данных :
4.32 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 10 118 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.хо
Описание конфигурации : набор данных Википедии для ho, проанализированный из дампа 20201201.
Размер загрузки :
19.30 KiB
Размер набора данных :
3.27 KiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.hr
Описание конфигурации : набор данных Википедии для hr, проанализированный из дампа 20201201.
Размер загрузки :
277.38 MiB
Размер набора данных :
408.92 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 254 662 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.hsb
Описание конфигурации : набор данных Википедии для hsb, проанализированный из дампа 20201201.
Размер загрузки :
10.84 MiB
Размер набора данных :
14.61 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 15 025 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.ht
Описание конфигурации : набор данных Википедии для ht, проанализированный из дампа 20201201.
Размер загрузки :
14.88 MiB
Размер набора данных :
42.39 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 61 756 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.hu
Описание конфигурации : набор данных Википедии для hu, проанализированный из дампа 20201201.
Размер загрузки :
909.08 MiB
Размер набора данных :
1.25 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 673 740 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.hy
Описание конфигурации : набор данных Википедии для hy, проанализированный из дампа 20201201.
Размер загрузки :
357.39 MiB
Размер набора данных :
967.47 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 627 523 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
википедия/20201201.иа
Описание конфигурации : набор данных Википедии для ia, проанализированный из дампа 20201201.
Размер загрузки :
9.15 MiB
Размер набора данных :
11.96 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 20 254 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.id
Описание конфигурации : набор данных Википедии для id, проанализированный из дампа 20201201.
Размер загрузки :
658.39 MiB
Размер набора данных :
865.16 MiB
.Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1 077 758 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.ie
Описание конфигурации : набор данных Википедии для ie, проанализированный из дампа 20201201.
Размер загрузки :
2.18 MiB
Размер набора данных :
3.28 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 5272 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.иг
Описание конфигурации : набор данных Википедии для ig, проанализированный из дампа 20201201.
Размер загрузки :
2.14 MiB
Размер набора данных :
2.83 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 3426 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.ii
Описание конфигурации : набор данных Википедии для ii, проанализированный из дампа 20201201.
Размер загрузки :
31.96 KiB
Размер набора данных :
8.31 KiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 14 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
википедия/20201201.ик
Описание конфигурации : набор данных Википедии для ik, проанализированный из дампа 20201201.
Размер загрузки :
257.86 KiB
Размер набора данных :
93.95 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 668 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
wikipedia/20201201.ilo
Описание конфигурации : набор данных Википедии для ilo, проанализированный из дампа 20201201.
Размер загрузки :
18.14 MiB
.Размер набора данных :
15.81 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 15 390 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.inh
Описание конфигурации : набор данных Википедии для inh, проанализированный из дампа 20201201.
Размер загрузки :
2.98 MiB
Размер набора данных :
1.34 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 2017 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.io
Описание конфигурации : набор данных Википедии для io, проанализированный из дампа 20201201.
Размер загрузки :
13.81 MiB
Размер набора данных :
30.11 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 31 448 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
википедия/20201201.is
Описание конфигурации : набор данных Википедии для is, проанализированный из дампа 20201201.
Размер загрузки :
47.31 MiB
Размер набора данных :
73.85 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 73 114 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.it
Описание конфига: набор данных Википедии для него, проанализированный из дампа 20201201.
Размер загрузки :
3.03 GiB
Размер набора данных :
3.91 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 2 001 603 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.ю
Описание конфигурации : набор данных Википедии для iu, проанализированный из дампа 20201201.
Размер загрузки :
311.91 KiB
Размер набора данных :
148.25 KiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 587 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.ja
Описание конфигурации : набор данных Википедии для ja, проанализированный из дампа 20201201.
Размер загрузки :
3.14 GiB
Размер набора данных :
5.61 GiB
Автоматическое кэширование ( документация ): Нет
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1 529 692 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.jam
Описание конфигурации : набор данных Википедии для варенья, проанализированный из дампа 20201201.
Размер загрузки :
925.16 KiB
Размер набора данных :
1.01 MiB
Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1720 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
Википедия/20201201.jbo
Описание конфигурации : набор данных Википедии для jbo, проанализированный из дампа 20201201.
Размер загрузки :
1.13 MiB
Размер набора данных :
2.32 MiB
.Автоматическое кэширование ( документация ): Да
Сплиты :
Расколоть | Примеры |
---|---|
'train' | 1330 |
- Примеры ( tfds.as_dataframe ): отображаются только для первых 100 конфигураций.
wikipedia/20201201.jv
Config description : Wikipedia dataset for jv, parsed from 20201201 dump.
Download size :
46.35 MiB
Dataset size :
57.72 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 79,598 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ka
Config description : Wikipedia dataset for ka, parsed from 20201201 dump.
Download size :
159.31 MiB
Dataset size :
543.59 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 182,623 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kaa
Config description : Wikipedia dataset for kaa, parsed from 20201201 dump.
Download size :
1.44 MiB
Dataset size :
1.78 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,197 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kab
Config description : Wikipedia dataset for kab, parsed from 20201201 dump.
Download size :
3.55 MiB
Dataset size :
3.40 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,058 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kbd
Config description : Wikipedia dataset for kbd, parsed from 20201201 dump.
Download size :
1.69 MiB
Dataset size :
2.74 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,607 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kbp
Config description : Wikipedia dataset for kbp, parsed from 20201201 dump.
Download size :
1.40 MiB
Dataset size :
3.36 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,915 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kg
Config description : Wikipedia dataset for kg, parsed from 20201201 dump.
Download size :
484.12 KiB
Dataset size :
292.64 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,271 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ki
Config description : Wikipedia dataset for ki, parsed from 20201201 dump.
Download size :
390.92 KiB
Dataset size :
309.05 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,486 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kj
Config description : Wikipedia dataset for kj, parsed from 20201201 dump.
Download size :
17.54 KiB
Dataset size :
4.93 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kk
Config description : Wikipedia dataset for kk, parsed from 20201201 dump.
Download size :
120.88 MiB
Dataset size :
424.64 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 270,628 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kl
Config description : Wikipedia dataset for kl, parsed from 20201201 dump.
Download size :
654.67 KiB
Dataset size :
447.23 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 867 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.km
Config description : Wikipedia dataset for km, parsed from 20201201 dump.
Download size :
25.74 MiB
Dataset size :
150.43 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 11,995 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kn
Config description : Wikipedia dataset for kn, parsed from 20201201 dump.
Download size :
76.13 MiB
Dataset size :
333.31 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 27,325 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ko
Config description : Wikipedia dataset for ko, parsed from 20201201 dump.
Download size :
747.33 MiB
Dataset size :
1.09 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,139,678 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.koi
Config description : Wikipedia dataset for koi, parsed from 20201201 dump.
Download size :
2.26 MiB
Dataset size :
4.74 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,967 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.krc
Config description : Wikipedia dataset for krc, parsed from 20201201 dump.
Download size :
3.25 MiB
Dataset size :
4.27 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,341 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ks
Config description : Wikipedia dataset for ks, parsed from 20201201 dump.
Download size :
363.64 KiB
Dataset size :
199.02 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 509 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ksh
Config description : Wikipedia dataset for ksh, parsed from 20201201 dump.
Download size :
3.18 MiB
Dataset size :
2.92 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,409 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ku
Config description : Wikipedia dataset for ku, parsed from 20201201 dump.
Download size :
21.18 MiB
Dataset size :
28.62 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 43,802 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kv
Config description : Wikipedia dataset for kv, parsed from 20201201 dump.
Download size :
3.58 MiB
Dataset size :
8.28 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,790 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.kw
Config description : Wikipedia dataset for kw, parsed from 20201201 dump.
Download size :
2.42 MiB
Dataset size :
2.15 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,524 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ky
Config description : Wikipedia dataset for ky, parsed from 20201201 dump.
Download size :
34.15 MiB
Dataset size :
147.20 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 79,798 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.la
Config description : Wikipedia dataset for la, parsed from 20201201 dump.
Download size :
89.33 MiB
Dataset size :
128.71 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 134,356 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lad
Config description : Wikipedia dataset for lad, parsed from 20201201 dump.
Download size :
3.41 MiB
Dataset size :
4.58 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,957 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lb
Config description : Wikipedia dataset for lb, parsed from 20201201 dump.
Download size :
49.54 MiB
Dataset size :
78.17 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 65,562 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lbe
Config description : Wikipedia dataset for lbe, parsed from 20201201 dump.
Download size :
1.39 MiB
Dataset size :
644.30 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,554 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lez
Config description : Wikipedia dataset for lez, parsed from 20201201 dump.
Download size :
4.75 MiB
Dataset size :
8.89 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,593 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lfn
Config description : Wikipedia dataset for lfn, parsed from 20201201 dump.
Download size :
4.00 MiB
Dataset size :
8.32 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,647 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lg
Config description : Wikipedia dataset for lg, parsed from 20201201 dump.
Download size :
1.69 MiB
Dataset size :
3.79 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,405 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.li
Config description : Wikipedia dataset for li, parsed from 20201201 dump.
Download size :
15.16 MiB
Dataset size :
26.01 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 15,238 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lij
Config description : Wikipedia dataset for lij, parsed from 20201201 dump.
Download size :
3.94 MiB
Dataset size :
5.27 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,441 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lmo
Config description : Wikipedia dataset for lmo, parsed from 20201201 dump.
Download size :
24.17 MiB
Dataset size :
32.41 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 51,386 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ln
Config description : Wikipedia dataset for ln, parsed from 20201201 dump.
Download size :
1.94 MiB
Dataset size :
1.69 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,294 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lo
Config description : Wikipedia dataset for lo, parsed from 20201201 dump.
Download size :
4.56 MiB
Dataset size :
12.09 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,536 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lrc
Config description : Wikipedia dataset for lrc, parsed from 20201201 dump.
Download size :
6.94 MiB
Dataset size :
4.63 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,216 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lt
Config description : Wikipedia dataset for lt, parsed from 20201201 dump.
Download size :
188.31 MiB
Dataset size :
293.73 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 226,648 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ltg
Config description : Wikipedia dataset for ltg, parsed from 20201201 dump.
Download size :
900.39 KiB
Dataset size :
860.83 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,005 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.lv
Config description : Wikipedia dataset for lv, parsed from 20201201 dump.
Download size :
145.93 MiB
Dataset size :
179.44 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 104,487 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mai
Config description : Wikipedia dataset for mai, parsed from 20201201 dump.
Download size :
11.77 MiB
Dataset size :
18.57 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,891 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.map-bms
Config description : Wikipedia dataset for map-bms, parsed from 20201201 dump.
Download size :
4.65 MiB
Dataset size :
4.67 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 13,882 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mdf
Config description : Wikipedia dataset for mdf, parsed from 20201201 dump.
Download size :
1.21 MiB
Dataset size :
1.75 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,363 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mg
Config description : Wikipedia dataset for mg, parsed from 20201201 dump.
Download size :
27.85 MiB
Dataset size :
63.42 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 129,968 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mh
Config description : Wikipedia dataset for mh, parsed from 20201201 dump.
Download size :
28.69 KiB
Dataset size :
11.04 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mhr
Config description : Wikipedia dataset for mhr, parsed from 20201201 dump.
Download size :
6.15 MiB
Dataset size :
16.94 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 12,408 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mi
Config description : Wikipedia dataset for mi, parsed from 20201201 dump.
Download size :
2.04 MiB
Dataset size :
3.51 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,203 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.min
Config description : Wikipedia dataset for min, parsed from 20201201 dump.
Download size :
29.45 MiB
Dataset size :
99.59 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 228,196 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mk
Config description : Wikipedia dataset for mk, parsed from 20201201 dump.
Download size :
166.60 MiB
Dataset size :
465.95 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 150,831 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ml
Config description : Wikipedia dataset for ml, parsed from 20201201 dump.
Download size :
143.17 MiB
Dataset size :
369.54 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 131,128 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mn
Config description : Wikipedia dataset for mn, parsed from 20201201 dump.
Download size :
32.25 MiB
Dataset size :
73.71 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 25,077 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mr
Config description : Wikipedia dataset for mr, parsed from 20201201 dump.
Download size :
58.88 MiB
Dataset size :
170.52 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 112,917 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mrj
Config description : Wikipedia dataset for mrj, parsed from 20201201 dump.
Download size :
3.20 MiB
Dataset size :
8.29 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 10,810 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ms
Config description : Wikipedia dataset for ms, parsed from 20201201 dump.
Download size :
250.50 MiB
Dataset size :
341.93 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 386,945 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mt
Config description : Wikipedia dataset for mt, parsed from 20201201 dump.
Download size :
9.06 MiB
Dataset size :
13.35 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,967 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mus
Config description : Wikipedia dataset for mus, parsed from 20201201 dump.
Download size :
15.13 KiB
Dataset size :
875 bytes
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mwl
Config description : Wikipedia dataset for mwl, parsed from 20201201 dump.
Download size :
9.19 MiB
Dataset size :
18.37 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,400 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.my
Config description : Wikipedia dataset for my, parsed from 20201201 dump.
Download size :
42.95 MiB
Dataset size :
195.80 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 54,562 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.myv
Config description : Wikipedia dataset for myv, parsed from 20201201 dump.
Download size :
9.65 MiB
Dataset size :
8.85 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,155 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.mzn
Config description : Wikipedia dataset for mzn, parsed from 20201201 dump.
Download size :
6.80 MiB
Dataset size :
11.24 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 18,599 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.na
Config description : Wikipedia dataset for na, parsed from 20201201 dump.
Download size :
531.75 KiB
Dataset size :
357.01 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,576 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nah
Config description : Wikipedia dataset for nah, parsed from 20201201 dump.
Download size :
4.51 MiB
Dataset size :
7.86 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 10,714 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nap
Config description : Wikipedia dataset for nap, parsed from 20201201 dump.
Download size :
5.31 MiB
Dataset size :
5.91 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 15,278 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nds
Config description : Wikipedia dataset for nds, parsed from 20201201 dump.
Download size :
42.06 MiB
Dataset size :
85.20 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 87,896 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nds-nl
Config description : Wikipedia dataset for nds-nl, parsed from 20201201 dump.
Download size :
7.29 MiB
Dataset size :
11.39 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 9,429 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ne
Config description : Wikipedia dataset for ne, parsed from 20201201 dump.
Download size :
37.50 MiB
Dataset size :
88.48 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 32,310 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.new
Config description : Wikipedia dataset for new, parsed from 20201201 dump.
Download size :
17.27 MiB
Dataset size :
140.32 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 72,998 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ng
Config description : Wikipedia dataset for ng, parsed from 20201201 dump.
Download size :
92.26 KiB
Dataset size :
66.12 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 21 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nl
Config description : Wikipedia dataset for nl, parsed from 20201201 dump.
Download size :
1.53 GiB
Dataset size :
2.21 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 2,523,440 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nn
Config description : Wikipedia dataset for nn, parsed from 20201201 dump.
Download size :
139.43 MiB
Dataset size :
208.84 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 231,090 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.no
Config description : Wikipedia dataset for no, parsed from 20201201 dump.
Download size :
649.54 MiB
Dataset size :
890.97 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 847,202 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nov
Config description : Wikipedia dataset for nov, parsed from 20201201 dump.
Download size :
1.16 MiB
Dataset size :
810.66 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,792 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nrm
Config description : Wikipedia dataset for nrm, parsed from 20201201 dump.
Download size :
1.86 MiB
Dataset size :
2.79 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,541 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nso
Config description : Wikipedia dataset for nso, parsed from 20201201 dump.
Download size :
2.29 MiB
Dataset size :
2.12 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8,282 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.nv
Config description : Wikipedia dataset for nv, parsed from 20201201 dump.
Download size :
4.32 MiB
Dataset size :
10.20 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 15,855 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ny
Config description : Wikipedia dataset for ny, parsed from 20201201 dump.
Download size :
1.45 MiB
Dataset size :
963.44 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 850 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.oc
Config description : Wikipedia dataset for oc, parsed from 20201201 dump.
Download size :
75.53 MiB
Dataset size :
111.16 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 94,068 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.olo
Config description : Wikipedia dataset for olo, parsed from 20201201 dump.
Download size :
1.95 MiB
Dataset size :
2.61 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,508 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.om
Config description : Wikipedia dataset for om, parsed from 20201201 dump.
Download size :
1.26 MiB
Dataset size :
1.70 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,163 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.or
Config description : Wikipedia dataset for or, parsed from 20201201 dump.
Download size :
28.60 MiB
Dataset size :
59.16 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 31,029 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.os
Config description : Wikipedia dataset for os, parsed from 20201201 dump.
Download size :
9.08 MiB
Dataset size :
9.88 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,964 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pa
Config description : Wikipedia dataset for pa, parsed from 20201201 dump.
Download size :
49.00 MiB
Dataset size :
129.86 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 44,984 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pag
Config description : Wikipedia dataset for pag, parsed from 20201201 dump.
Download size :
1.66 MiB
Dataset size :
1.72 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,942 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pam
Config description : Wikipedia dataset for pam, parsed from 20201201 dump.
Download size :
9.11 MiB
Dataset size :
7.38 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8,794 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pap
Config description : Wikipedia dataset for pap, parsed from 20201201 dump.
Download size :
1.50 MiB
Dataset size :
2.03 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,179 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pcd
Config description : Wikipedia dataset for pcd, parsed from 20201201 dump.
Download size :
4.89 MiB
Dataset size :
4.96 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,113 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pdc
Config description : Wikipedia dataset for pdc, parsed from 20201201 dump.
Download size :
1.16 MiB
Dataset size :
1.09 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,424 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pfl
Config description : Wikipedia dataset for pfl, parsed from 20201201 dump.
Download size :
3.51 MiB
Dataset size :
3.43 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,933 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pi
Config description : Wikipedia dataset for pi, parsed from 20201201 dump.
Download size :
631.83 KiB
Dataset size :
2.05 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,074 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pih
Config description : Wikipedia dataset for pih, parsed from 20201201 dump.
Download size :
750.70 KiB
Dataset size :
230.96 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 844 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pl
Config description : Wikipedia dataset for pl, parsed from 20201201 dump.
Download size :
1.98 GiB
Dataset size :
2.46 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,765,088 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pms
Config description : Wikipedia dataset for pms, parsed from 20201201 dump.
Download size :
13.90 MiB
Dataset size :
30.80 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 66,115 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pnb
Config description : Wikipedia dataset for pnb, parsed from 20201201 dump.
Download size :
72.45 MiB
Dataset size :
209.71 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 64,698 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pnt
Config description : Wikipedia dataset for pnt, parsed from 20201201 dump.
Download size :
549.36 KiB
Dataset size :
590.82 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 532 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ps
Config description : Wikipedia dataset for ps, parsed from 20201201 dump.
Download size :
21.45 MiB
Dataset size :
46.15 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 13,138 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.pt
Config description : Wikipedia dataset for pt, parsed from 20201201 dump.
Download size :
1.79 GiB
Dataset size :
2.24 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,491,646 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.qu
Config description : Wikipedia dataset for qu, parsed from 20201201 dump.
Download size :
12.49 MiB
Dataset size :
15.85 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 31,387 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.rm
Config description : Wikipedia dataset for rm, parsed from 20201201 dump.
Download size :
6.92 MiB
Dataset size :
16.52 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,863 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.rmy
Config description : Wikipedia dataset for rmy, parsed from 20201201 dump.
Download size :
553.83 KiB
Dataset size :
396.09 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 733 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.rn
Config description : Wikipedia dataset for rn, parsed from 20201201 dump.
Download size :
815.81 KiB
Dataset size :
361.36 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 713 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ro
Config description : Wikipedia dataset for ro, parsed from 20201201 dump.
Download size :
502.59 MiB
Dataset size :
693.68 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 414,477 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.roa-rup
Config description : Wikipedia dataset for roa-rup, parsed from 20201201 dump.
Download size :
1002.33 KiB
Dataset size :
1.11 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,260 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.roa-tara
Config description : Wikipedia dataset for roa-tara, parsed from 20201201 dump.
Download size :
6.20 MiB
Dataset size :
6.37 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 9,375 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ru
Config description : Wikipedia dataset for ru, parsed from 20201201 dump.
Download size :
4.02 GiB
Dataset size :
8.08 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 2,732,016 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.rue
Config description : Wikipedia dataset for rue, parsed from 20201201 dump.
Download size :
5.41 MiB
Dataset size :
9.82 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8,503 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.rw
Config description : Wikipedia dataset for rw, parsed from 20201201 dump.
Download size :
1.21 MiB
Dataset size :
1.60 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,142 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sa
Config description : Wikipedia dataset for sa, parsed from 20201201 dump.
Download size :
15.19 MiB
Dataset size :
58.08 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 22,040 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sah
Config description : Wikipedia dataset for sah, parsed from 20201201 dump.
Download size :
13.61 MiB
Dataset size :
35.90 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 16,796 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sat
Config description : Wikipedia dataset for sat, parsed from 20201201 dump.
Download size :
10.00 MiB
Dataset size :
23.52 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,480 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sc
Config description : Wikipedia dataset for sc, parsed from 20201201 dump.
Download size :
6.11 MiB
Dataset size :
9.70 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,970 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.scn
Config description : Wikipedia dataset for scn, parsed from 20201201 dump.
Download size :
12.05 MiB
Dataset size :
16.53 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 31,416 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sco
Config description : Wikipedia dataset for sco, parsed from 20201201 dump.
Download size :
57.27 MiB
Dataset size :
47.09 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 42,615 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sd
Config description : Wikipedia dataset for sd, parsed from 20201201 dump.
Download size :
17.62 MiB
Dataset size :
31.18 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 20,282 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.se
Config description : Wikipedia dataset for se, parsed from 20201201 dump.
Download size :
3.88 MiB
Dataset size :
3.36 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8,561 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sg
Config description : Wikipedia dataset for sg, parsed from 20201201 dump.
Download size :
313.06 KiB
Dataset size :
93.31 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 295 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sh
Config description : Wikipedia dataset for sh, parsed from 20201201 dump.
Download size :
423.87 MiB
Dataset size :
822.87 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 3,935,417 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.si
Config description : Wikipedia dataset for si, parsed from 20201201 dump.
Download size :
41.32 MiB
Dataset size :
112.97 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 27,846 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.simple
Config description : Wikipedia dataset for simple, parsed from 20201201 dump.
Download size :
193.55 MiB
Dataset size :
197.50 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 177,615 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sk
Config description : Wikipedia dataset for sk, parsed from 20201201 dump.
Download size :
275.53 MiB
Dataset size :
356.27 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 253,372 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sl
Config description : Wikipedia dataset for sl, parsed from 20201201 dump.
Download size :
228.16 MiB
Dataset size :
360.64 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 202,357 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sm
Config description : Wikipedia dataset for sm, parsed from 20201201 dump.
Download size :
839.52 KiB
Dataset size :
750.10 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,023 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sn
Config description : Wikipedia dataset for sn, parsed from 20201201 dump.
Download size :
2.97 MiB
Dataset size :
4.90 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,779 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.so
Config description : Wikipedia dataset for so, parsed from 20201201 dump.
Download size :
9.13 MiB
Dataset size :
9.83 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,979 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sq
Config description : Wikipedia dataset for sq, parsed from 20201201 dump.
Download size :
92.58 MiB
Dataset size :
153.56 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 111,846 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sr
Config description : Wikipedia dataset for sr, parsed from 20201201 dump.
Download size :
825.89 MiB
Dataset size :
1.58 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 3,116,253 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.srn
Config description : Wikipedia dataset for srn, parsed from 20201201 dump.
Download size :
655.77 KiB
Dataset size :
614.35 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,253 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ss
Config description : Wikipedia dataset for ss, parsed from 20201201 dump.
Download size :
827.67 KiB
Dataset size :
490.69 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 554 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.st
Config description : Wikipedia dataset for st, parsed from 20201201 dump.
Download size :
673.61 KiB
Dataset size :
580.35 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,136 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.stq
Config description : Wikipedia dataset for stq, parsed from 20201201 dump.
Download size :
3.44 MiB
Dataset size :
4.62 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,510 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.su
Config description : Wikipedia dataset for su, parsed from 20201201 dump.
Download size :
25.46 MiB
Dataset size :
40.87 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 66,493 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sv
Config description : Wikipedia dataset for sv, parsed from 20201201 dump.
Download size :
1.67 GiB
Dataset size :
2.79 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 5,750,968 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.sw
Config description : Wikipedia dataset for sw, parsed from 20201201 dump.
Download size :
33.18 MiB
Dataset size :
52.26 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 60,185 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.szl
Config description : Wikipedia dataset for szl, parsed from 20201201 dump.
Download size :
11.88 MiB
Dataset size :
17.27 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 53,270 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ta
Config description : Wikipedia dataset for ta, parsed from 20201201 dump.
Download size :
165.13 MiB
Dataset size :
632.77 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 167,112 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tcy
Config description : Wikipedia dataset for tcy, parsed from 20201201 dump.
Download size :
3.64 MiB
Dataset size :
7.79 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,684 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.te
Config description : Wikipedia dataset for te, parsed from 20201201 dump.
Download size :
110.19 MiB
Dataset size :
591.09 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 94,652 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tet
Config description : Wikipedia dataset for tet, parsed from 20201201 dump.
Download size :
1.25 MiB
Dataset size :
1.32 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,602 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tg
Config description : Wikipedia dataset for tg, parsed from 20201201 dump.
Download size :
42.76 MiB
Dataset size :
110.97 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 105,298 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.th
Config description : Wikipedia dataset for th, parsed from 20201201 dump.
Download size :
290.74 MiB
Dataset size :
823.58 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 245,869 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ti
Config description : Wikipedia dataset for ti, parsed from 20201201 dump.
Download size :
533.37 KiB
Dataset size :
376.02 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 369 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tk
Config description : Wikipedia dataset for tk, parsed from 20201201 dump.
Download size :
5.03 MiB
Dataset size :
10.63 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,122 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tl
Config description : Wikipedia dataset for tl, parsed from 20201201 dump.
Download size :
61.86 MiB
Dataset size :
66.60 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 64,930 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tn
Config description : Wikipedia dataset for tn, parsed from 20201201 dump.
Download size :
1.42 MiB
Dataset size :
1.48 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 834 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.to
Config description : Wikipedia dataset for to, parsed from 20201201 dump.
Download size :
818.38 KiB
Dataset size :
921.00 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,628 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tpi
Config description : Wikipedia dataset for tpi, parsed from 20201201 dump.
Download size :
1.45 MiB
Dataset size :
408.34 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,656 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tr
Config description : Wikipedia dataset for tr, parsed from 20201201 dump.
Download size :
613.30 MiB
Dataset size :
724.38 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 624,333 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ts
Config description : Wikipedia dataset for ts, parsed from 20201201 dump.
Download size :
1.59 MiB
Dataset size :
713.63 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 713 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tt
Config description : Wikipedia dataset for tt, parsed from 20201201 dump.
Download size :
75.07 MiB
Dataset size :
248.79 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 278,882 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tum
Config description : Wikipedia dataset for tum, parsed from 20201201 dump.
Download size :
352.25 KiB
Dataset size :
231.66 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 718 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tw
Config description : Wikipedia dataset for tw, parsed from 20201201 dump.
Download size :
449.69 KiB
Dataset size :
339.91 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 782 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ty
Config description : Wikipedia dataset for ty, parsed from 20201201 dump.
Download size :
517.96 KiB
Dataset size :
260.86 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,291 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.tyv
Config description : Wikipedia dataset for tyv, parsed from 20201201 dump.
Download size :
4.59 MiB
Dataset size :
11.86 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,779 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.udm
Config description : Wikipedia dataset for udm, parsed from 20201201 dump.
Download size :
3.39 MiB
Dataset size :
6.07 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,191 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ug
Config description : Wikipedia dataset for ug, parsed from 20201201 dump.
Download size :
7.70 MiB
Dataset size :
36.13 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,258 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.uk
Config description : Wikipedia dataset for uk, parsed from 20201201 dump.
Download size :
1.60 GiB
Dataset size :
3.66 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,611,728 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ur
Config description : Wikipedia dataset for ur, parsed from 20201201 dump.
Download size :
162.89 MiB
Dataset size :
264.08 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 350,090 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.uz
Config description : Wikipedia dataset for uz, parsed from 20201201 dump.
Download size :
67.47 MiB
Dataset size :
99.16 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 158,823 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.ve
Config description : Wikipedia dataset for ve, parsed from 20201201 dump.
Download size :
283.99 KiB
Dataset size :
219.86 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 446 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.vec
Config description : Wikipedia dataset for vec, parsed from 20201201 dump.
Download size :
21.88 MiB
Dataset size :
28.21 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 71,790 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.vep
Config description : Wikipedia dataset for vep, parsed from 20201201 dump.
Download size :
6.30 MiB
Dataset size :
9.16 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8,027 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.vi
Config description : Wikipedia dataset for vi, parsed from 20201201 dump.
Download size :
793.00 MiB
Dataset size :
1.32 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,465,721 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.vls
Config description : Wikipedia dataset for vls, parsed from 20201201 dump.
Download size :
7.03 MiB
Dataset size :
10.33 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,778 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.vo
Config description : Wikipedia dataset for vo, parsed from 20201201 dump.
Download size :
24.97 MiB
Dataset size :
80.77 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 125,494 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.wa
Config description : Wikipedia dataset for wa, parsed from 20201201 dump.
Download size :
8.29 MiB
Dataset size :
12.44 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,373 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.war
Config description : Wikipedia dataset for war, parsed from 20201201 dump.
Download size :
263.43 MiB
Dataset size :
412.79 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,264,845 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.wo
Config description : Wikipedia dataset for wo, parsed from 20201201 dump.
Download size :
1.97 MiB
Dataset size :
3.25 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,664 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.wuu
Config description : Wikipedia dataset for wuu, parsed from 20201201 dump.
Download size :
15.28 MiB
Dataset size :
20.74 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 42,762 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.xal
Config description : Wikipedia dataset for xal, parsed from 20201201 dump.
Download size :
1.71 MiB
Dataset size :
1.17 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,801 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.xh
Config description : Wikipedia dataset for xh, parsed from 20201201 dump.
Download size :
1.52 MiB
Dataset size :
1.77 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,373 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.xmf
Config description : Wikipedia dataset for xmf, parsed from 20201201 dump.
Download size :
11.13 MiB
Dataset size :
26.69 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 16,061 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.yi
Config description : Wikipedia dataset for yi, parsed from 20201201 dump.
Download size :
12.62 MiB
Dataset size :
33.30 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 25,227 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.yo
Config description : Wikipedia dataset for yo, parsed from 20201201 dump.
Download size :
14.22 MiB
Dataset size :
12.09 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 33,548 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.za
Config description : Wikipedia dataset for za, parsed from 20201201 dump.
Download size :
791.45 KiB
Dataset size :
721.42 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,496 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.zea
Config description : Wikipedia dataset for zea, parsed from 20201201 dump.
Download size :
2.56 MiB
Dataset size :
4.46 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,599 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.zh
Config description : Wikipedia dataset for zh, parsed from 20201201 dump.
Download size :
2.05 GiB
Dataset size :
2.08 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,670,356 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.zh-classical
Config description : Wikipedia dataset for zh-classical, parsed from 20201201 dump.
Download size :
14.89 MiB
Dataset size :
10.27 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 12,237 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.zh-min-nan
Config description : Wikipedia dataset for zh-min-nan, parsed from 20201201 dump.
Download size :
73.64 MiB
Dataset size :
130.73 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 448,229 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.zh-yue
Config description : Wikipedia dataset for zh-yue, parsed from 20201201 dump.
Download size :
67.14 MiB
Dataset size :
71.77 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 103,834 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20201201.zu
Config description : Wikipedia dataset for zu, parsed from 20201201 dump.
Download size :
2.43 MiB
Dataset size :
2.08 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,359 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.aa
Config description : Wikipedia dataset for aa, parsed from 20200301 dump.
Download size :
44.96 KiB
Dataset size :
3.46 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ab
Config description : Wikipedia dataset for ab, parsed from 20200301 dump.
Download size :
1.74 MiB
Dataset size :
2.79 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,108 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ace
Config description : Wikipedia dataset for ace, parsed from 20200301 dump.
Download size :
2.93 MiB
Dataset size :
3.69 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 11,501 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ady
Config description : Wikipedia dataset for ady, parsed from 20200301 dump.
Download size :
394.09 KiB
Dataset size :
505.97 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 553 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.af
Config description : Wikipedia dataset for af, parsed from 20200301 dump.
Download size :
99.17 MiB
Dataset size :
179.95 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 110,483 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ak
Config description : Wikipedia dataset for ak, parsed from 20200301 dump.
Download size :
462.66 KiB
Dataset size :
247.24 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 993 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.als
Config description : Wikipedia dataset for als, parsed from 20200301 dump.
Download size :
51.03 MiB
Dataset size :
68.56 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 29,318 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.am
Config description : Wikipedia dataset for am, parsed from 20200301 dump.
Download size :
6.82 MiB
Dataset size :
16.64 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 13,400 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.an
Config description : Wikipedia dataset for an, parsed from 20200301 dump.
Download size :
32.94 MiB
Dataset size :
46.63 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 50,774 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ang
Config description : Wikipedia dataset for ang, parsed from 20200301 dump.
Download size :
4.13 MiB
Dataset size :
2.43 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,249 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ar
Config description : Wikipedia dataset for ar, parsed from 20200301 dump.
Download size :
1.08 GiB
Dataset size :
2.09 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,972,799 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.arc
Config description : Wikipedia dataset for arc, parsed from 20200301 dump.
Download size :
1.03 MiB
Dataset size :
778.26 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,305 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.arz
Config description : Wikipedia dataset for arz, parsed from 20200301 dump.
Download size :
36.61 MiB
Dataset size :
115.13 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 157,001 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.as
Config description : Wikipedia dataset for as, parsed from 20200301 dump.
Download size :
21.48 MiB
Dataset size :
40.49 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,509 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ast
Config description : Wikipedia dataset for ast, parsed from 20200301 dump.
Download size :
217.68 MiB
Dataset size :
445.91 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 108,220 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.atj
Config description : Wikipedia dataset for atj, parsed from 20200301 dump.
Download size :
546.89 KiB
Dataset size :
664.04 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,175 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.av
Config description : Wikipedia dataset for av, parsed from 20200301 dump.
Download size :
4.47 MiB
Dataset size :
3.23 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,075 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ay
Config description : Wikipedia dataset for ay, parsed from 20200301 dump.
Download size :
2.19 MiB
Dataset size :
4.04 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,039 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.az
Config description : Wikipedia dataset for az, parsed from 20200301 dump.
Download size :
181.30 MiB
Dataset size :
317.17 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 175,038 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.azb
Config description : Wikipedia dataset for azb, parsed from 20200301 dump.
Download size :
76.38 MiB
Dataset size :
131.83 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 208,456 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ba
Config description : Wikipedia dataset for ba, parsed from 20200301 dump.
Download size :
64.46 MiB
Dataset size :
181.18 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 56,822 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bar
Config description : Wikipedia dataset for bar, parsed from 20200301 dump.
Download size :
32.17 MiB
Dataset size :
40.40 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 46,363 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bat-smg
Config description : Wikipedia dataset for bat-smg, parsed from 20200301 dump.
Download size :
4.82 MiB
Dataset size :
6.63 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 19,665 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bcl
Config description : Wikipedia dataset for bcl, parsed from 20200301 dump.
Download size :
7.59 MiB
Dataset size :
8.70 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 9,581 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.be
Config description : Wikipedia dataset for be, parsed from 20200301 dump.
Download size :
208.69 MiB
Dataset size :
433.16 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 185,758 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.be-x-old
Config description : Wikipedia dataset for be-x-old, parsed from 20200301 dump.
Download size :
79.73 MiB
Dataset size :
178.12 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 99,513 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bg
Config description : Wikipedia dataset for bg, parsed from 20200301 dump.
Download size :
344.69 MiB
Dataset size :
866.33 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 377,391 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bh
Config description : Wikipedia dataset for bh, parsed from 20200301 dump.
Download size :
13.79 MiB
Dataset size :
10.36 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,035 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bi
Config description : Wikipedia dataset for bi, parsed from 20200301 dump.
Download size :
444.50 KiB
Dataset size :
298.56 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,392 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bjn
Config description : Wikipedia dataset for bjn, parsed from 20200301 dump.
Download size :
2.68 MiB
Dataset size :
2.57 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,431 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bm
Config description : Wikipedia dataset for bm, parsed from 20200301 dump.
Download size :
464.48 KiB
Dataset size :
351.32 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 745 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bn
Config description : Wikipedia dataset for bn, parsed from 20200301 dump.
Download size :
183.92 MiB
Dataset size :
482.94 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 119,216 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bo
Config description : Wikipedia dataset for bo, parsed from 20200301 dump.
Download size :
13.17 MiB
Dataset size :
116.42 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 11,575 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bpy
Config description : Wikipedia dataset for bpy, parsed from 20200301 dump.
Download size :
5.11 MiB
Dataset size :
39.43 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 25,416 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.br
Config description : Wikipedia dataset for br, parsed from 20200301 dump.
Download size :
50.39 MiB
Dataset size :
72.08 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 77,940 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bs
Config description : Wikipedia dataset for bs, parsed from 20200301 dump.
Download size :
110.31 MiB
Dataset size :
150.33 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 185,885 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bug
Config description : Wikipedia dataset for bug, parsed from 20200301 dump.
Download size :
1.82 MiB
Dataset size :
2.74 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,411 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.bxr
Config description : Wikipedia dataset for bxr, parsed from 20200301 dump.
Download size :
3.26 MiB
Dataset size :
5.67 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,653 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ca
Config description : Wikipedia dataset for ca, parsed from 20200301 dump.
Download size :
899.00 MiB
Dataset size :
1.50 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 698,894 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.cbk-zam
Config description : Wikipedia dataset for cbk-zam, parsed from 20200301 dump.
Download size :
1.86 MiB
Dataset size :
2.94 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,366 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.cdo
Config description : Wikipedia dataset for cdo, parsed from 20200301 dump.
Download size :
4.37 MiB
Dataset size :
3.99 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 16,785 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ce
Config description : Wikipedia dataset for ce, parsed from 20200301 dump.
Download size :
49.70 MiB
Dataset size :
254.09 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 259,152 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ceb
Config description : Wikipedia dataset for ceb, parsed from 20200301 dump.
Download size :
1.84 GiB
Dataset size :
3.68 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 5,378,741 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ch
Config description : Wikipedia dataset for ch, parsed from 20200301 dump.
Download size :
707.12 KiB
Dataset size :
167.80 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 541 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.cho
Config description : Wikipedia dataset for cho, parsed from 20200301 dump.
Download size :
26.88 KiB
Dataset size :
7.44 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.chr
Config description : Wikipedia dataset for chr, parsed from 20200301 dump.
Download size :
644.28 KiB
Dataset size :
629.37 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 962 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.chy
Config description : Wikipedia dataset for chy, parsed from 20200301 dump.
Download size :
340.35 KiB
Dataset size :
116.39 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 780 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ckb
Config description : Wikipedia dataset for ckb, parsed from 20200301 dump.
Download size :
26.96 MiB
Dataset size :
46.82 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 25,695 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.co
Config description : Wikipedia dataset for co, parsed from 20200301 dump.
Download size :
3.54 MiB
Dataset size :
5.85 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,465 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.cr
Config description : Wikipedia dataset for cr, parsed from 20200301 dump.
Download size :
271.60 KiB
Dataset size :
31.60 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 120 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.crh
Config description : Wikipedia dataset for crh, parsed from 20200301 dump.
Download size :
4.38 MiB
Dataset size :
2.74 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,093 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.cs
Config description : Wikipedia dataset for cs, parsed from 20200301 dump.
Download size :
825.14 MiB
Dataset size :
1.15 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 574,136 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.csb
Config description : Wikipedia dataset for csb, parsed from 20200301 dump.
Download size :
2.13 MiB
Dataset size :
3.36 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,696 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.cu
Config description : Wikipedia dataset for cu, parsed from 20200301 dump.
Download size :
665.69 KiB
Dataset size :
672.01 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,520 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.cv
Config description : Wikipedia dataset for cv, parsed from 20200301 dump.
Download size :
23.37 MiB
Dataset size :
59.96 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 45,907 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.cy
Config description : Wikipedia dataset for cy, parsed from 20200301 dump.
Download size :
69.14 MiB
Dataset size :
100.36 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 147,899 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.da
Config description : Wikipedia dataset for da, parsed from 20200301 dump.
Download size :
341.55 MiB
Dataset size :
457.15 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 257,349 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.de
Config description : Wikipedia dataset for de, parsed from 20200301 dump.
Download size :
5.32 GiB
Dataset size :
7.52 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 3,104,703 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.din
Config description : Wikipedia dataset for din, parsed from 20200301 dump.
Download size :
490.49 KiB
Dataset size :
462.00 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 284 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.diq
Config description : Wikipedia dataset for diq, parsed from 20200301 dump.
Download size :
8.36 MiB
Dataset size :
7.87 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 16,255 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.dsb
Config description : Wikipedia dataset for dsb, parsed from 20200301 dump.
Download size :
3.73 MiB
Dataset size :
3.06 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,495 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.dty
Config description : Wikipedia dataset for dty, parsed from 20200301 dump.
Download size :
6.52 MiB
Dataset size :
5.89 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,559 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.dv
Config description : Wikipedia dataset for dv, parsed from 20200301 dump.
Download size :
4.35 MiB
Dataset size :
12.40 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,262 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.dz
Config description : Wikipedia dataset for dz, parsed from 20200301 dump.
Download size :
377.61 KiB
Dataset size :
799.74 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 294 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ee
Config description : Wikipedia dataset for ee, parsed from 20200301 dump.
Download size :
460.80 KiB
Dataset size :
207.60 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 381 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.el
Config description : Wikipedia dataset for el, parsed from 20200301 dump.
Download size :
359.36 MiB
Dataset size :
937.56 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 244,313 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.eml
Config description : Wikipedia dataset for eml, parsed from 20200301 dump.
Download size :
8.14 MiB
Dataset size :
3.44 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,208 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.en
Config description : Wikipedia dataset for en, parsed from 20200301 dump.
Download size :
16.73 GiB
Dataset size :
17.05 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 6,033,151 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.eo
Config description : Wikipedia dataset for eo, parsed from 20200301 dump.
Download size :
264.90 MiB
Dataset size :
405.95 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 379,859 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.es
Config description : Wikipedia dataset for es, parsed from 20200301 dump.
Download size :
3.16 GiB
Dataset size :
4.58 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 2,837,472 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.et
Config description : Wikipedia dataset for et, parsed from 20200301 dump.
Download size :
211.83 MiB
Dataset size :
352.11 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 317,330 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.eu
Config description : Wikipedia dataset for eu, parsed from 20200301 dump.
Download size :
195.51 MiB
Dataset size :
386.22 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 437,022 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ext
Config description : Wikipedia dataset for ext, parsed from 20200301 dump.
Download size :
2.50 MiB
Dataset size :
3.56 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,486 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.fa
Config description : Wikipedia dataset for fa, parsed from 20200301 dump.
Download size :
769.97 MiB
Dataset size :
1.33 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 2,316,555 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ff
Config description : Wikipedia dataset for ff, parsed from 20200301 dump.
Download size :
417.26 KiB
Dataset size :
280.51 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 313 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.fi
Config description : Wikipedia dataset for fi, parsed from 20200301 dump.
Download size :
703.73 MiB
Dataset size :
923.20 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 656,462 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.fiu-vro
Config description : Wikipedia dataset for fiu-vro, parsed from 20200301 dump.
Download size :
2.06 MiB
Dataset size :
3.41 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,132 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.fj
Config description : Wikipedia dataset for fj, parsed from 20200301 dump.
Download size :
400.67 KiB
Dataset size :
278.31 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 853 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.fo
Config description : Wikipedia dataset for fo, parsed from 20200301 dump.
Download size :
14.07 MiB
Dataset size :
13.50 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 13,325 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.fr
Config description : Wikipedia dataset for fr, parsed from 20200301 dump.
Download size :
4.46 GiB
Dataset size :
6.00 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 2,186,354 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.frp
Config description : Wikipedia dataset for frp, parsed from 20200301 dump.
Download size :
2.19 MiB
Dataset size :
1.53 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,937 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.frr
Config description : Wikipedia dataset for frr, parsed from 20200301 dump.
Download size :
8.73 MiB
Dataset size :
5.93 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 11,448 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.fur
Config description : Wikipedia dataset for fur, parsed from 20200301 dump.
Download size :
2.33 MiB
Dataset size :
3.47 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,563 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.fy
Config description : Wikipedia dataset for fy, parsed from 20200301 dump.
Download size :
49.88 MiB
Dataset size :
94.24 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 43,510 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ga
Config description : Wikipedia dataset for ga, parsed from 20200301 dump.
Download size :
27.12 MiB
Dataset size :
43.30 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 58,490 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gag
Config description : Wikipedia dataset for gag, parsed from 20200301 dump.
Download size :
2.04 MiB
Dataset size :
2.28 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,011 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gan
Config description : Wikipedia dataset for gan, parsed from 20200301 dump.
Download size :
3.85 MiB
Dataset size :
2.44 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,513 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gd
Config description : Wikipedia dataset for gd, parsed from 20200301 dump.
Download size :
8.72 MiB
Dataset size :
12.45 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 15,158 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gl
Config description : Wikipedia dataset for gl, parsed from 20200301 dump.
Download size :
254.09 MiB
Dataset size :
376.97 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 215,685 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.glk
Config description : Wikipedia dataset for glk, parsed from 20200301 dump.
Download size :
2.02 MiB
Dataset size :
4.25 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,784 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gn
Config description : Wikipedia dataset for gn, parsed from 20200301 dump.
Download size :
3.50 MiB
Dataset size :
5.27 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,493 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gom
Config description : Wikipedia dataset for gom, parsed from 20200301 dump.
Download size :
6.24 MiB
Dataset size :
29.42 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,436 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gor
Config description : Wikipedia dataset for gor, parsed from 20200301 dump.
Download size :
1.67 MiB
Dataset size :
2.20 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,006 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.got
Config description : Wikipedia dataset for got, parsed from 20200301 dump.
Download size :
673.14 KiB
Dataset size :
1.27 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 940 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gu
Config description : Wikipedia dataset for gu, parsed from 20200301 dump.
Download size :
28.55 MiB
Dataset size :
106.99 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 29,103 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.gv
Config description : Wikipedia dataset for gv, parsed from 20200301 dump.
Download size :
5.36 MiB
Dataset size :
4.38 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,020 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ha
Config description : Wikipedia dataset for ha, parsed from 20200301 dump.
Download size :
2.54 MiB
Dataset size :
3.01 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,856 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.hak
Config description : Wikipedia dataset for hak, parsed from 20200301 dump.
Download size :
3.74 MiB
Dataset size :
3.97 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 11,894 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.haw
Config description : Wikipedia dataset for haw, parsed from 20200301 dump.
Download size :
1.50 MiB
Dataset size :
2.86 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,308 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.he
Config description : Wikipedia dataset for he, parsed from 20200301 dump.
Download size :
626.91 MiB
Dataset size :
1.36 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 424,381 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.hi
Config description : Wikipedia dataset for hi, parsed from 20200301 dump.
Download size :
151.17 MiB
Dataset size :
520.31 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 168,552 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.hif
Config description : Wikipedia dataset for hif, parsed from 20200301 dump.
Download size :
4.62 MiB
Dataset size :
4.24 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 10,054 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ho
Config description : Wikipedia dataset for ho, parsed from 20200301 dump.
Download size :
19.24 KiB
Dataset size :
3.27 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.hr
Config description : Wikipedia dataset for hr, parsed from 20200301 dump.
Download size :
261.83 MiB
Dataset size :
389.49 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 243,050 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.hsb
Config description : Wikipedia dataset for hsb, parsed from 20200301 dump.
Download size :
10.63 MiB
Dataset size :
14.40 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,878 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ht
Config description : Wikipedia dataset for ht, parsed from 20200301 dump.
Download size :
13.19 MiB
Dataset size :
38.84 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 59,271 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.hu
Config description : Wikipedia dataset for hu, parsed from 20200301 dump.
Download size :
863.44 MiB
Dataset size :
1.19 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 654,141 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.hy
Config description : Wikipedia dataset for hy, parsed from 20200301 dump.
Download size :
309.20 MiB
Dataset size :
846.57 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 589,352 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ia
Config description : Wikipedia dataset for ia, parsed from 20200301 dump.
Download size :
8.64 MiB
Dataset size :
11.52 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 19,556 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.id
Config description : Wikipedia dataset for id, parsed from 20200301 dump.
Download size :
595.70 MiB
Dataset size :
809.23 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,033,265 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ie
Config description : Wikipedia dataset for ie, parsed from 20200301 dump.
Download size :
1.85 MiB
Dataset size :
2.82 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,766 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ig
Config description : Wikipedia dataset for ig, parsed from 20200301 dump.
Download size :
1.13 MiB
Dataset size :
1.18 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,797 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ii
Config description : Wikipedia dataset for ii, parsed from 20200301 dump.
Download size :
31.73 KiB
Dataset size :
8.31 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ik
Config description : Wikipedia dataset for ik, parsed from 20200301 dump.
Download size :
251.48 KiB
Dataset size :
94.27 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 669 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ilo
Config description : Wikipedia dataset for ilo, parsed from 20200301 dump.
Download size :
16.98 MiB
Dataset size :
14.92 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,221 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.inh
Config description : Wikipedia dataset for inh, parsed from 20200301 dump.
Download size :
2.15 MiB
Dataset size :
1.10 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,597 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.io
Config description : Wikipedia dataset for io, parsed from 20200301 dump.
Download size :
13.17 MiB
Dataset size :
29.29 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 30,720 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.is
Config description : Wikipedia dataset for is, parsed from 20200301 dump.
Download size :
44.88 MiB
Dataset size :
70.66 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 70,348 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.it
Config description : Wikipedia dataset for it, parsed from 20200301 dump.
Download size :
2.85 GiB
Dataset size :
3.72 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,907,437 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.iu
Config description : Wikipedia dataset for iu, parsed from 20200301 dump.
Download size :
292.01 KiB
Dataset size :
153.39 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 512 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ja
Config description : Wikipedia dataset for ja, parsed from 20200301 dump.
Download size :
2.95 GiB
Dataset size :
5.33 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,459,322 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.jam
Config description : Wikipedia dataset for jam, parsed from 20200301 dump.
Download size :
908.86 KiB
Dataset size :
1.01 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,708 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.jbo
Config description : Wikipedia dataset for jbo, parsed from 20200301 dump.
Download size :
1.09 MiB
Dataset size :
2.31 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,320 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.jv
Config description : Wikipedia dataset for jv, parsed from 20200301 dump.
Download size :
42.41 MiB
Dataset size :
54.26 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 75,864 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ka
Config description : Wikipedia dataset for ka, parsed from 20200301 dump.
Download size :
142.65 MiB
Dataset size :
480.54 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 170,803 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kaa
Config description : Wikipedia dataset for kaa, parsed from 20200301 dump.
Download size :
1.38 MiB
Dataset size :
1.73 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,183 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kab
Config description : Wikipedia dataset for kab, parsed from 20200301 dump.
Download size :
2.99 MiB
Dataset size :
2.96 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,612 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kbd
Config description : Wikipedia dataset for kbd, parsed from 20200301 dump.
Download size :
1.67 MiB
Dataset size :
2.74 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,611 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kbp
Config description : Wikipedia dataset for kbp, parsed from 20200301 dump.
Download size :
1.33 MiB
Dataset size :
3.19 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,797 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kg
Config description : Wikipedia dataset for kg, parsed from 20200301 dump.
Download size :
452.75 KiB
Dataset size :
255.06 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,242 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ki
Config description : Wikipedia dataset for ki, parsed from 20200301 dump.
Download size :
377.70 KiB
Dataset size :
310.31 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,486 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kj
Config description : Wikipedia dataset for kj, parsed from 20200301 dump.
Download size :
17.46 KiB
Dataset size :
4.93 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kk
Config description : Wikipedia dataset for kk, parsed from 20200301 dump.
Download size :
116.81 MiB
Dataset size :
417.74 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 269,235 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kl
Config description : Wikipedia dataset for kl, parsed from 20200301 dump.
Download size :
874.37 KiB
Dataset size :
574.59 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,708 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.km
Config description : Wikipedia dataset for km, parsed from 20200301 dump.
Download size :
23.63 MiB
Dataset size :
132.41 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 11,773 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kn
Config description : Wikipedia dataset for kn, parsed from 20200301 dump.
Download size :
73.08 MiB
Dataset size :
323.92 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 26,349 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ko
Config description : Wikipedia dataset for ko, parsed from 20200301 dump.
Download size :
685.64 MiB
Dataset size :
1.02 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 1,053,176 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.koi
Config description : Wikipedia dataset for koi, parsed from 20200301 dump.
Download size :
2.18 MiB
Dataset size :
4.74 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,968 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.krc
Config description : Wikipedia dataset for krc, parsed from 20200301 dump.
Download size :
3.20 MiB
Dataset size :
4.24 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,329 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ks
Config description : Wikipedia dataset for ks, parsed from 20200301 dump.
Download size :
331.45 KiB
Dataset size :
153.64 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 443 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ksh
Config description : Wikipedia dataset for ksh, parsed from 20200301 dump.
Download size :
3.11 MiB
Dataset size :
2.86 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,375 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ku
Config description : Wikipedia dataset for ku, parsed from 20200301 dump.
Download size :
18.20 MiB
Dataset size :
24.55 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 34,513 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kv
Config description : Wikipedia dataset for kv, parsed from 20200301 dump.
Download size :
3.46 MiB
Dataset size :
8.16 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,759 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.kw
Config description : Wikipedia dataset for kw, parsed from 20200301 dump.
Download size :
1.92 MiB
Dataset size :
1.76 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,027 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ky
Config description : Wikipedia dataset for ky, parsed from 20200301 dump.
Download size :
33.38 MiB
Dataset size :
146.62 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 79,687 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.la
Config description : Wikipedia dataset for la, parsed from 20200301 dump.
Download size :
85.88 MiB
Dataset size :
123.90 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 132,256 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lad
Config description : Wikipedia dataset for lad, parsed from 20200301 dump.
Download size :
3.37 MiB
Dataset size :
4.57 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,943 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lb
Config description : Wikipedia dataset for lb, parsed from 20200301 dump.
Download size :
47.48 MiB
Dataset size :
75.73 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 63,849 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lbe
Config description : Wikipedia dataset for lbe, parsed from 20200301 dump.
Download size :
1.30 MiB
Dataset size :
643.83 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,549 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lez
Config description : Wikipedia dataset for lez, parsed from 20200301 dump.
Download size :
4.42 MiB
Dataset size :
8.31 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,448 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lfn
Config description : Wikipedia dataset for lfn, parsed from 20200301 dump.
Download size :
3.65 MiB
Dataset size :
7.58 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,308 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lg
Config description : Wikipedia dataset for lg, parsed from 20200301 dump.
Download size :
1.59 MiB
Dataset size :
3.69 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2,365 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.li
Config description : Wikipedia dataset for li, parsed from 20200301 dump.
Download size :
14.58 MiB
Dataset size :
25.08 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,721 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lij
Config description : Wikipedia dataset for lij, parsed from 20200301 dump.
Download size :
3.02 MiB
Dataset size :
4.28 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,543 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lmo
Config description : Wikipedia dataset for lmo, parsed from 20200301 dump.
Download size :
21.87 MiB
Dataset size :
28.70 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 45,704 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ln
Config description : Wikipedia dataset for ln, parsed from 20200301 dump.
Download size :
1.89 MiB
Dataset size :
1.67 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 3,265 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lo
Config description : Wikipedia dataset for lo, parsed from 20200301 dump.
Download size :
4.24 MiB
Dataset size :
11.47 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,463 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lrc
Config description : Wikipedia dataset for lrc, parsed from 20200301 dump.
Download size :
5.55 MiB
Dataset size :
3.52 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 5,953 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lt
Config description : Wikipedia dataset for lt, parsed from 20200301 dump.
Download size :
182.22 MiB
Dataset size :
286.61 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 223,184 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ltg
Config description : Wikipedia dataset for ltg, parsed from 20200301 dump.
Download size :
878.96 KiB
Dataset size :
860.05 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,002 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.lv
Config description : Wikipedia dataset for lv, parsed from 20200301 dump.
Download size :
137.56 MiB
Dataset size :
170.66 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 100,641 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mai
Config description : Wikipedia dataset for mai, parsed from 20200301 dump.
Download size :
11.43 MiB
Dataset size :
18.05 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,774 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.map-bms
Config description : Wikipedia dataset for map-bms, parsed from 20200301 dump.
Download size :
4.55 MiB
Dataset size :
4.60 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 13,680 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mdf
Config description : Wikipedia dataset for mdf, parsed from 20200301 dump.
Download size :
1.14 MiB
Dataset size :
1.73 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,354 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mg
Config description : Wikipedia dataset for mg, parsed from 20200301 dump.
Download size :
26.66 MiB
Dataset size :
61.98 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 128,813 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mh
Config description : Wikipedia dataset for mh, parsed from 20200301 dump.
Download size :
28.59 KiB
Dataset size :
11.04 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mhr
Config description : Wikipedia dataset for mhr, parsed from 20200301 dump.
Download size :
5.90 MiB
Dataset size :
16.53 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 12,302 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mi
Config description : Wikipedia dataset for mi, parsed from 20200301 dump.
Download size :
1.99 MiB
Dataset size :
3.50 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 7,187 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.min
Config description : Wikipedia dataset for min, parsed from 20200301 dump.
Download size :
27.69 MiB
Dataset size :
98.11 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 227,688 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mk
Config description : Wikipedia dataset for mk, parsed from 20200301 dump.
Download size :
152.75 MiB
Dataset size :
432.82 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 145,820 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ml
Config description : Wikipedia dataset for ml, parsed from 20200301 dump.
Download size :
130.77 MiB
Dataset size :
340.30 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 123,672 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mn
Config description : Wikipedia dataset for mn, parsed from 20200301 dump.
Download size :
30.40 MiB
Dataset size :
71.21 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 24,252 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mr
Config description : Wikipedia dataset for mr, parsed from 20200301 dump.
Download size :
53.71 MiB
Dataset size :
149.28 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 101,310 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mrj
Config description : Wikipedia dataset for mrj, parsed from 20200301 dump.
Download size :
3.10 MiB
Dataset size :
8.31 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 10,831 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ms
Config description : Wikipedia dataset for ms, parsed from 20200301 dump.
Download size :
228.62 MiB
Dataset size :
318.42 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 373,578 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mt
Config description : Wikipedia dataset for mt, parsed from 20200301 dump.
Download size :
8.53 MiB
Dataset size :
12.70 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,748 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mus
Config description : Wikipedia dataset for mus, parsed from 20200301 dump.
Download size :
15.08 KiB
Dataset size :
875 bytes
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 2 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mwl
Config description : Wikipedia dataset for mwl, parsed from 20200301 dump.
Download size :
9.09 MiB
Dataset size :
18.23 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,332 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.my
Config description : Wikipedia dataset for my, parsed from 20200301 dump.
Download size :
37.69 MiB
Dataset size :
177.44 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 48,451 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.myv
Config description : Wikipedia dataset for myv, parsed from 20200301 dump.
Download size :
8.87 MiB
Dataset size :
7.87 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 6,566 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.mzn
Config description : Wikipedia dataset for mzn, parsed from 20200301 dump.
Download size :
6.63 MiB
Dataset size :
11.11 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 18,486 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.na
Config description : Wikipedia dataset for na, parsed from 20200301 dump.
Download size :
495.83 KiB
Dataset size :
334.74 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,319 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nah
Config description : Wikipedia dataset for nah, parsed from 20200301 dump.
Download size :
4.37 MiB
Dataset size :
7.84 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 10,672 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nap
Config description : Wikipedia dataset for nap, parsed from 20200301 dump.
Download size :
5.15 MiB
Dataset size :
5.83 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 15,191 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nds
Config description : Wikipedia dataset for nds, parsed from 20200301 dump.
Download size :
37.74 MiB
Dataset size :
75.85 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 65,024 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nds-nl
Config description : Wikipedia dataset for nds-nl, parsed from 20200301 dump.
Download size :
6.92 MiB
Dataset size :
10.86 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8,976 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ne
Config description : Wikipedia dataset for ne, parsed from 20200301 dump.
Download size :
32.89 MiB
Dataset size :
86.01 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 34,609 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.new
Config description : Wikipedia dataset for new, parsed from 20200301 dump.
Download size :
16.96 MiB
Dataset size :
140.19 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 72,895 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ng
Config description : Wikipedia dataset for ng, parsed from 20200301 dump.
Download size :
91.98 KiB
Dataset size :
66.12 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 21 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nl
Config description : Wikipedia dataset for nl, parsed from 20200301 dump.
Download size :
1.45 GiB
Dataset size :
2.13 GiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 2,464,920 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nn
Config description : Wikipedia dataset for nn, parsed from 20200301 dump.
Download size :
132.55 MiB
Dataset size :
200.31 MiB
Auto-cached ( documentation ): Only when
shuffle_files=False
(train)Splits :
Split | Examples |
---|---|
'train' | 225,543 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.no
Config description : Wikipedia dataset for no, parsed from 20200301 dump.
Download size :
619.74 MiB
Dataset size :
861.07 MiB
Auto-cached ( documentation ): No
Splits :
Split | Examples |
---|---|
'train' | 822,320 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nov
Config description : Wikipedia dataset for nov, parsed from 20200301 dump.
Download size :
1.14 MiB
Dataset size :
810.05 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,790 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nrm
Config description : Wikipedia dataset for nrm, parsed from 20200301 dump.
Download size :
1.74 MiB
Dataset size :
2.70 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,356 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nso
Config description : Wikipedia dataset for nso, parsed from 20200301 dump.
Download size :
2.26 MiB
Dataset size :
2.12 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 8,248 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.nv
Config description : Wikipedia dataset for nv, parsed from 20200301 dump.
Download size :
3.48 MiB
Dataset size :
8.00 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 12,199 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.ny
Config description : Wikipedia dataset for ny, parsed from 20200301 dump.
Download size :
1.29 MiB
Dataset size :
752.91 KiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 630 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.oc
Config description : Wikipedia dataset for oc, parsed from 20200301 dump.
Download size :
73.98 MiB
Dataset size :
110.92 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 95,125 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.olo
Config description : Wikipedia dataset for olo, parsed from 20200301 dump.
Download size :
1.80 MiB
Dataset size :
2.52 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 4,278 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.om
Config description : Wikipedia dataset for om, parsed from 20200301 dump.
Download size :
1.10 MiB
Dataset size :
1.59 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 1,099 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.or
Config description : Wikipedia dataset for or, parsed from 20200301 dump.
Download size :
26.72 MiB
Dataset size :
55.44 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 30,267 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.os
Config description : Wikipedia dataset for os, parsed from 20200301 dump.
Download size :
7.76 MiB
Dataset size :
9.04 MiB
Auto-cached ( documentation ): Yes
Splits :
Split | Examples |
---|---|
'train' | 14,078 |
- Examples ( tfds.as_dataframe ): Only shown for the first 100 configs.
wikipedia/20200301.pa
Config description : Wikipedia dataset for pa, parsed from 20200301 dump.
Download size :
45.93 MiB
Dataset size :
118.68 MiB
Auto-cached ( documentation ): Yes
Splits :