common_voice

 • Mô tả :

Bộ dữ liệu Mozilla Common Voice

FeaturesDict({
  'accent': Text(shape=(), dtype=string),
  'age': Text(shape=(), dtype=string),
  'client_id': Text(shape=(), dtype=string),
  'downvotes': Scalar(shape=(), dtype=int32),
  'gender': ClassLabel(shape=(), dtype=int64, num_classes=3),
  'segment': Text(shape=(), dtype=string),
  'sentence': Text(shape=(), dtype=string),
  'upvotes': Scalar(shape=(), dtype=int32),
  'voice': Audio(shape=(None,), dtype=int64),
})
 • Tài liệu tính năng :
Tính năng Lớp Hình dạng Dtype Sự mô tả
Tính năngDict
giọng Chữ sợi dây Giọng của người nói, xem https://github.com/common-voice/common-voice/blob/main/web/src/stores/demographics.ts
tuổi tác Chữ sợi dây Nhóm tuổi của người nói (ví dụ: thanh thiếu niên hoặc bốn mươi), xem https://github.com/common-voice/common-voice/blob/main/web/src/stores/demographics.ts
client_id Chữ sợi dây UUID đã băm của một người dùng nhất định
phản đối Vô hướng int32 Số người cho biết âm thanh không khớp với văn bản
giới tính LớpNhãn int64 Giới tính của người nói
bộ phận Chữ sợi dây Nếu câu thuộc về phân đoạn tập dữ liệu tùy chỉnh, câu đó sẽ được liệt kê ở đây
kết án Chữ sợi dây Phiên âm giả định của âm thanh
ủng hộ Vô hướng int32 Số người cho biết âm thanh khớp với văn bản
tiếng nói âm thanh (Không có,) int64

common_voice/en (cấu hình mặc định)

 • Mô tả cấu hình : Ngôn ngữ Mã: en

 • Kích thước tải xuống : 56.45 GiB

 • Kích thước tập dữ liệu : 2.79 TiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 16,164
'test' 16,164
'train' 564.337
'validation' 1.224.864

common_voice/ab

 • Mô tả cấu hình : Ngôn ngữ Mã: ab

 • Kích thước tải xuống : 39.14 MiB

 • Kích thước tập dữ liệu : 133.24 MiB

 • Tự động lưu vào bộ đệm ( tài liệu ): Có

 • Chia tách :

Tách ra ví dụ
'test' 9
'train' 22
'validation' 31

common_voice/ar

 • Mô tả cấu hình : Ngôn ngữ Mã: ar

 • Kích thước tải xuống : 1.64 GiB

 • Kích thước tập dữ liệu : 67.16 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 7,517
'test' 7,622
'train' 14,227
'validation' 43,291

common_voice/as

 • Mô tả cấu hình : Ngôn ngữ Mã: as

 • Kích thước tải xuống : 21.20 MiB

 • Kích thước tập dữ liệu : 1.65 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 124
'test' 110
'train' 270
'validation' 504

common_voice/br

 • Mô tả cấu hình : Ngôn ngữ Mã: br

 • Kích thước tải xuống : 443.72 MiB

 • Kích thước tập dữ liệu : 13.46 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.997
'test' 2,087
'train' 2.780
'validation' 8.560

common_voice/ca

 • Mô tả cấu hình : Ngôn ngữ Mã: ca

 • Kích thước tải xuống : 19.32 GiB

 • Kích thước tập dữ liệu : 1.19 TiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 15,724
'test' 15,724
'train' 285,584
'validation' 416,701

common_voice/cnh

 • Mô tả cấu hình : Ngôn ngữ Mã: cnh

 • Kích thước tải xuống : 153.86 MiB

 • Kích thước tập dữ liệu : 5.12 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 756
'test' 752
'train' 807
'validation' 2.432

common_voice/cs

 • Mô tả cấu hình : Ngôn ngữ Mã: cs

 • Kích thước tải xuống : 1.18 GiB

 • Kích thước tập dữ liệu : 56.89 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 4.118
'test' 4,144
'train' 5,655
'validation' 30,431

common_voice/cv

 • Mô tả cấu hình : Ngôn ngữ Mã: cv

 • Kích thước tải xuống : 418.98 MiB

 • Kích thước tập dữ liệu : 8.10 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 818
'test' 788
'train' 931
'validation' 3,496

common_voice/cy

 • Mô tả cấu hình : Ngôn ngữ Mã: cy

 • Kích thước tải xuống : 3.20 GiB

 • Kích thước tập dữ liệu : 128.68 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 4,776
'test' 4.820
'train' 6,839
'validation' 72,984

common_voice/de

 • Mô tả cấu hình : Ngôn ngữ Mã: de

 • Kích thước tải xuống : 21.68 GiB

 • Kích thước tập dữ liệu : 1.29 TiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 15,588
'test' 15,588
'train' 246,525
'validation' 565,186

common_voice/dv

 • Mô tả cấu hình : Ngôn ngữ Mã: dv

 • Kích thước tải xuống : 515.45 MiB

 • Kích thước tập dữ liệu : 31.59 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 2,077
'test' 2,202
'train' 2.680
'validation' 11,866

common_voice/el

 • Mô tả cấu hình : Ngôn ngữ Mã: el

 • Kích thước tải xuống : 363.89 MiB

 • Kích thước tập dữ liệu : 14.62 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.401
'test' 1.522
'train' 2.316
'validation' 5,996

common_voice/eo

 • Mô tả cấu hình : Ngôn ngữ Mã: eo

 • Kích thước tải xuống : 2.69 GiB

 • Kích thước tập dữ liệu : 167.14 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 8,987
'test' 8,969
'train' 19,587
'validation' 58,094

common_voice/es

 • Mô tả cấu hình : Ngôn ngữ Mã: es

 • Kích thước tải xuống : 15.08 GiB

 • Kích thước tập dữ liệu: 684.66 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 15,089
'test' 15,089
'train' 161,813
'validation' 236,314

common_voice/et

 • Mô tả cấu hình : Ngôn ngữ Mã: et

 • Kích thước tải xuống : 731.63 MiB

 • Kích thước tập dữ liệu : 37.95 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 2,507
'test' 2.509
'train' 2.966
'validation' 10,683

common_voice/eu

 • Mô tả cấu hình : Ngôn ngữ Mã: eu

 • Kích thước tải xuống : 3.41 GiB

 • Kích thước tập dữ liệu : 127.60 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 5,172
'test' 5,172
'train' 7,505
'validation' 63,009

common_voice/fa

 • Mô tả cấu hình : Ngôn ngữ Mã: fa

 • Kích thước tải xuống : 8.27 GiB

 • Kích thước tập dữ liệu : 328.61 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 5,213
'test' 5,213
'train' 7,593
'validation' 251,659

common_voice/fi

 • Mô tả cấu hình : Ngôn ngữ Mã: fi

 • Kích thước tải xuống : 47.57 MiB

 • Kích thước tập dữ liệu : 3.41 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 415
'test' 428
'train' 460
'validation' 1.305

common_voice/fr

 • Mô tả cấu hình : Ngôn ngữ Mã: fr

 • Kích thước tải xuống : 17.82 GiB

 • Kích thước tập dữ liệu : 1.17 TiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 15,763
'test' 15,763
'train' 298.982
'validation' 461,004

common_voice/fy-NL

 • Mô tả cấu hình : Ngôn ngữ Mã: fy-NL

 • Kích thước tải xuống : 1.15 GiB

 • Kích thước tập dữ liệu : 29.93 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 2.790
'test' 3,020
'train' 3,927
'validation' 10,495

common_voice/ga-IE

 • Mô tả cấu hình : Ngôn ngữ Mã: ga-IE

 • Kích thước tải xuống : 149.30 MiB

 • Kích thước tập dữ liệu : 5.11 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 497
'test' 506
'train' 541
'validation' 3.352

common_voice/xin chào

 • Mô tả cấu hình : Ngôn ngữ Mã: hi

 • Kích thước tải xuống : 20.43 MiB

 • Kích thước tập dữ liệu : 1.15 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 135
'test' 127
'train' 157
'validation' 419

common_voice/hsb

 • Mô tả cấu hình : Ngôn ngữ Mã: hsb

 • Kích thước tải xuống : 75.69 MiB

 • Kích thước tập dữ liệu : 5.67 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 172
'test' 387
'train' 808
'validation' 1.367

common_voice/hu

 • Mô tả cấu hình : Ngôn ngữ Mã: hu

 • Kích thước tải xuống : 231.51 MiB

 • Kích thước tập dữ liệu : 17.07 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1,434
'test' 1.649
'train' 3.348
'validation' 6,457

common_voice/ia

 • Mô tả cấu hình : Ngôn ngữ Mã: ia

 • Kích thước tải xuống : 216.01 MiB

 • Kích thước tập dữ liệu : 14.99 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.601
'test' 899
'train' 3,477
'validation' 5,978

common_voice/id

 • Mô tả cấu hình : Ngôn ngữ Mã: id

 • Kích thước tải xuống : 453.87 MiB

 • Kích thước tập dữ liệu : 17.20 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.835
'test' 1.844
'train' 2.130
'validation' 8,696

common_voice/nó

 • Mô tả cấu hình : Ngôn ngữ Mã: it

 • Kích thước tải xuống : 5.20 GiB

 • Kích thước tập dữ liệu: 316.38 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 12,928
'test' 12,928
'train' 58,015
'validation' 102,579

common_voice/ja

 • Mô tả cấu hình : Ngôn ngữ Mã: ja

 • Kích thước tải xuống : 145.80 MiB

 • Kích thước tập dữ liệu : 6.83 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 586
'test' 632
'train' 722
'validation' 3,072

common_voice/ka

 • Mô tả cấu hình : Ngôn ngữ Mã: ka

 • Kích thước tải xuống : 99.45 MiB

 • Kích thước tập dữ liệu : 7.51 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 527
'test' 656
'train' 1.058
'validation' 2.275

common_voice/kab

 • Mô tả cấu hình : Ngôn ngữ Mã: kab

 • Kích thước tải xuống : 15.99 GiB

 • Kích thước tập dữ liệu : 718.51 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 14,622
'test' 14,622
'train' 120.530
'validation' 573,718

common_voice/ky

 • Mô tả cấu hình : Ngôn ngữ Mã: ky

 • Kích thước tải xuống : 552.60 MiB

 • Kích thước tập dữ liệu : 18.70 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.511
'test' 1.503
'train' 1.955
'validation' 9,236

common_voice/lg

 • Mô tả cấu hình : Ngôn ngữ Mã: lg

 • Kích thước tải xuống : 198.55 MiB

 • Kích thước tập dữ liệu : 6.65 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 384
'test' 584
'train' 1.250
'validation' 2.220

common_voice/lt

 • Mô tả cấu hình : Ngôn ngữ Mã: lt

 • Kích thước tải xuống : 129.03 MiB

 • Kích thước tập dữ liệu : 4.79 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 244
'test' 466
'train' 931
'validation' 1.644

common_voice/lv

 • Mô tả cấu hình : Ngôn ngữ Mã: lv

 • Kích thước tải xuống : 198.66 MiB

 • Kích thước tập dữ liệu : 13.07 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 2.002
'test' 1.882
'train' 2.552
'validation' 6,444

common_voice/mn

 • Mô tả cấu hình : Ngôn ngữ Mã: mn

 • Kích thước tải xuống : 463.84 MiB

 • Kích thước tập dữ liệu : 22.09 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.837
'test' 1.862
'train' 2.183
'validation' 7,487

common_voice/mt

 • Mô tả cấu hình : Ngôn ngữ Mã: mt

 • Kích thước tải xuống : 405.42 MiB

 • Kích thước tập dữ liệu : 15.09 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.516
'test' 1.617
'train' 2.036
'validation' 5,747

common_voice/nl

 • Mô tả cấu hình : Ngôn ngữ Mã: nl

 • Kích thước tải xuống : 1.62 GiB

 • Kích thước tập dữ liệu : 90.20 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 4.938
'test' 5,708
'train' 9.460
'validation' 52,488

common_voice/hoặc

 • Mô tả cấu hình : Ngôn ngữ Mã: hoặc

 • Kích thước tải xuống : 189.85 MiB

 • Kích thước tập dữ liệu : 1.97 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 129
'test' 98
'train' 388
'validation' 615

common_voice/pa-IN

 • Mô tả cấu hình : Ngôn ngữ Mã: pa-IN

 • Kích thước tải xuống : 66.52 MiB

 • Kích thước tập dữ liệu : 1.03 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 44
'test' 116
'train' 211
'validation' 371

common_voice/pl

 • Mô tả cấu hình : Ngôn ngữ Mã: pl

 • Kích thước tải xuống : 3.29 GiB

 • Kích thước tập dữ liệu : 141.06 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 5,153
'test' 5,153
'train' 7,468
'validation' 90,791

common_voice/pt

 • Mô tả cấu hình : Ngôn ngữ Mã: pt

 • Kích thước tải xuống : 1.59 GiB

 • Kích thước tập dữ liệu : 75.64 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 4,592
'test' 4.641
'train' 6,514
'validation' 41,584

common_voice/rm-sursilv

 • Mô tả cấu hình : Ngôn ngữ Mã: rm-sursilv

 • Kích thước tải xuống : 263.17 MiB

 • Kích thước tập dữ liệu : 12.31 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.205
'test' 1.194
'train' 1.384
'validation' 3,783

common_voice/rm-vallader

 • Mô tả cấu hình : Ngôn ngữ Mã: rm-vallader

 • Kích thước tải xuống : 103.11 MiB

 • Kích thước tập dữ liệu : 4.89 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 357
'test' 378
'train' 574
'validation' 1.316

common_voice/ro

 • Mô tả cấu hình : Ngôn ngữ Mã: ro

 • Kích thước tải xuống : 249.84 MiB

 • Kích thước tập dữ liệu : 14.54 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 858
'test' 1.778
'train' 3,399
'validation' 6.039

common_voice/ru

 • Mô tả cấu hình : Ngôn ngữ Mã: ru

 • Kích thước tải xuống : 3.40 GiB

 • Kích thước tập dữ liệu : 175.04 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 7,963
'test' 8,007
'train' 15,481
'validation' 74,256

common_voice/rw

 • Mô tả cấu hình : Ngôn ngữ Mã: rw

 • Kích thước tải xuống : 39.62 GiB

 • Kích thước tập dữ liệu : 2.18 TiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 15,032
'test' 15,724
'train' 515,197
'validation' 832,929

common_voice/sah

 • Mô tả cấu hình : Ngôn ngữ Mã: sah

 • Kích thước tải xuống : 172.85 MiB

 • Kích thước tập dữ liệu : 9.42 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 405
'test' 757
'train' 1,442
'validation' 2.606

common_voice/sl

 • Mô tả cấu hình : Ngôn ngữ Mã: sl

 • Kích thước tải xuống : 212.43 MiB

 • Kích thước tập dữ liệu : 9.67 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 556
'test' 881
'train' 2.038
'validation' 4.669

common_voice/sv-SE

 • Mô tả cấu hình : Ngôn ngữ Mã: sv-SE

 • Kích thước tải xuống : 401.91 MiB

 • Kích thước tập dữ liệu : 18.27 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 2.019
'test' 2.027
'train' 2.331
'validation' 12,552

common_voice/ta

 • Mô tả cấu hình : Ngôn ngữ Mã: ta

 • Kích thước tải xuống : 648.28 MiB

 • Kích thước tập dữ liệu : 24.06 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.779
'test' 1.781
'train' 2.009
'validation' 12,652

common_voice/th

 • Mô tả cấu hình : Ngôn ngữ Mã: th

 • Kích thước tải xuống : 325.49 MiB

 • Kích thước tập dữ liệu : 18.32 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1,922
'test' 2.188
'train' 2,917
'validation' 7.028

common_voice/tr

 • Mô tả cấu hình : Ngôn ngữ Mã: tr

 • Kích thước tải xuống : 592.09 MiB

 • Kích thước tập dữ liệu : 28.21 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 1.647
'test' 1.647
'train' 1.831
'validation' 18,685

chung_voice/tt

 • Mô tả cấu hình : Ngôn ngữ Mã: tt

 • Kích thước tải xuống : 741.15 MiB

 • Kích thước tập dữ liệu : 46.85 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 2.127
'test' 4,485
'train' 11,211
'validation' 25,781

common_voice/uk

 • Mô tả cấu hình : Ngôn ngữ Mã: uk

 • Kích thước tải xuống : 1.13 GiB

 • Kích thước tập dữ liệu : 49.66 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 3,236
'test' 3.235
'train' 4.035
'validation' 22,337

common_voice/vi

 • Mô tả cấu hình : Ngôn ngữ Mã: vi

 • Kích thước tải xuống : 49.52 MiB

 • Kích thước tập dữ liệu : 1.47 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 200
'test' 198
'train' 221
'validation' 619

common_voice/bình chọn

 • Mô tả cấu hình : Ngôn ngữ Mã: vote

 • Kích thước tải xuống : 7.43 MiB

 • Kích thước tập dữ liệu : 11.39 MiB

 • Tự động lưu vào bộ đệm ( tài liệu ): Có

 • Chia tách :

Tách ra ví dụ
'train' 3
'validation' 3

common_voice/zh-CN

 • Mô tả cấu hình : Ngôn ngữ Mã: zh-CN

 • Kích thước tải xuống : 2.03 GiB

 • Kích thước tập dữ liệu : 122.54 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 8,743
'test' 8.760
'train' 18,541
'validation' 36,405

common_voice/zh-HK

 • Mô tả cấu hình : Ngôn ngữ Mã: zh-HK

 • Kích thước tải xuống : 2.58 GiB

 • Kích thước tập dữ liệu : 78.80 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 5,172
'test' 5,172
'train' 7,506
'validation' 41,835

common_voice/zh-TW

 • Mô tả cấu hình : Ngôn ngữ Mã: zh-TW

 • Kích thước tải xuống : 2.03 GiB

 • Kích thước tập dữ liệu : 69.06 GiB

 • Tự động lưu vào bộ nhớ cache ( tài liệu ): Không

 • Chia tách :

Tách ra ví dụ
'dev' 2.895
'test' 2.895
'train' 3,507
'validation' 61,232