cmaterdb

このデータセットには、次の画像が含まれています - 手書きのバングラ数字 - 合計 6000 のバングラ数字 (32x32 RGB カラー、6000 画像) のバランスの取れたデータセットで、各クラス (桁ごと) に 600 画像があります。手書きデーバナーガリー数字 - 合計 3000 デーバナーガリー数字 (32x32 RGB カラー、3000 画像) のバランスの取れたデータセットで、それぞれがクラスごと (数字ごと) に 300 画像を持っています。手書きのテルグ数字 - 合計 3000 のテルグ数字 (32x32 RGB カラー、3000 の画像) のバランスのとれたデータセットで、各クラス (桁ごと) に 300 の画像があります。

CMATERdb は、インドのジャダプール大学にある「トレーニング教育と研究のためのマイクロプロセッサ アプリケーション センター」(CMATER) 研究所で作成されたパターン認識データベース リポジトリです。

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • 機能のドキュメント:
特徴クラスDtype説明
特徴辞書
画像画像(32, 32, 3) uint8
ラベルクラスラベルint64
@article{Das:2012:GAB:2161007.2161320,
  author = {Das, Nibaran and Sarkar, Ram and Basu, Subhadip and Kundu, Mahantapas
            and Nasipuri, Mita and Basu, Dipak Kumar},
  title = {A Genetic Algorithm Based Region Sampling for Selection of Local Features
          in Handwritten Digit Recognition Application},
  journal = {Appl. Soft Comput.},
  issue_date = {May, 2012},
  volume = {12},
  number = {5},
  month = may,
  year = {2012},
  issn = {1568-4946},
  pages = {1592--1606},
  numpages = {15},
  url = {http://dx.doi.org/10.1016/j.asoc.2011.11.030},
  doi = {10.1016/j.asoc.2011.11.030},
  acmid = {2161320},
  publisher = {Elsevier Science Publishers B. V.},
  address = {Amsterdam, The Netherlands, The Netherlands},
  keywords = {Feature selection, Genetic algorithm, N-Quality consensus,
  Optimal local regions, Region sampling, Variable sized local regions},
}
@article{Das:2012:SFC:2240301.2240421,
  author = {Das, Nibaran and Reddy, Jagan Mohan and Sarkar, Ram and Basu, Subhadip and Kundu,
            Mahantapas and Nasipuri, Mita and Basu, Dipak Kumar},
  title = {A Statistical-topological Feature Combination for Recognition of Handwritten Numerals},
  journal = {Appl. Soft Comput.},
  issue_date = {August, 2012},
  volume = {12},
  number = {8},
  month = aug,
  year = {2012},
  issn = {1568-4946},
  pages = {2486--2495},
  numpages = {10},
  url = {http://dx.doi.org/10.1016/j.asoc.2012.03.039},
  doi = {10.1016/j.asoc.2012.03.039},
  acmid = {2240421},
  publisher = {Elsevier Science Publishers B. V.},
  address = {Amsterdam, The Netherlands, The Netherlands},
  keywords = {Character recognition, Feature combination, MPCA, PCA, SVM, Statistical, Topological},
}

cmatedb/bangla (デフォルト設定)

  • 構成の説明: CMATERdb バングラ数字

  • ダウンロードサイズ: 573.81 KiB

  • データセットサイズ: 1.71 MiB

  • スプリット:

スプリット
'test' 1,000
'train' 5,000

視覚化

cmaterdb/デバナーガリー

  • 構成の説明: CMATERdb Devangari Numerals

  • ダウンロードサイズ: 275.29 KiB

  • データセットサイズ: 869.50 KiB

  • スプリット:

スプリット
'test' 500
'train' 2,500

視覚化

cmaterdb/テルグ語

  • 構成の説明: CMATERdb テルグ数字

  • ダウンロードサイズ: 283.90 KiB

  • データセットサイズ: 860.47 KiB

  • スプリット:

スプリット
'test' 500
'train' 2,500

視覚化