cmaterdb

このデータセットには、-手書きのバングラ数字-合計6000のバングラ数字(32x32 RGBカラー、6000画像)のバランスの取れたデータセットが含まれ、それぞれがクラスごと(1桁あたり)600の画像を持っています。手書きのデーバナーガリー数字-合計3000個のデーバナーガリー数字(32x32 RGBカラー、3000画像)のバランスの取れたデータセットで、それぞれがクラスごと(1桁あたり)300枚の画像を持っています。手書きのテルグ語の数字-合計3000個のテルグ語の数字(32x32 RGBカラー、3000枚の画像)のバランスの取れたデータセットで、それぞれがクラスごと(1桁あたり)に300枚の画像を持っています。

CMATERdbは、インドのジャダフプール大学の「トレーニング教育および研究のためのマイクロプロセッサアプリケーションセンター」(CMATER)研究所で作成されたパターン認識データベースリポジトリです。

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=tf.uint8),
    'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
})
@article{Das:2012:GAB:2161007.2161320,
  author = {Das, Nibaran and Sarkar, Ram and Basu, Subhadip and Kundu, Mahantapas
            and Nasipuri, Mita and Basu, Dipak Kumar},
  title = {A Genetic Algorithm Based Region Sampling for Selection of Local Features
          in Handwritten Digit Recognition Application},
  journal = {Appl. Soft Comput.},
  issue_date = {May, 2012},
  volume = {12},
  number = {5},
  month = may,
  year = {2012},
  issn = {1568-4946},
  pages = {1592--1606},
  numpages = {15},
  url = {http://dx.doi.org/10.1016/j.asoc.2011.11.030},
  doi = {10.1016/j.asoc.2011.11.030},
  acmid = {2161320},
  publisher = {Elsevier Science Publishers B. V.},
  address = {Amsterdam, The Netherlands, The Netherlands},
  keywords = {Feature selection, Genetic algorithm, N-Quality consensus,
  Optimal local regions, Region sampling, Variable sized local regions},
}
@article{Das:2012:SFC:2240301.2240421,
  author = {Das, Nibaran and Reddy, Jagan Mohan and Sarkar, Ram and Basu, Subhadip and Kundu,
            Mahantapas and Nasipuri, Mita and Basu, Dipak Kumar},
  title = {A Statistical-topological Feature Combination for Recognition of Handwritten Numerals},
  journal = {Appl. Soft Comput.},
  issue_date = {August, 2012},
  volume = {12},
  number = {8},
  month = aug,
  year = {2012},
  issn = {1568-4946},
  pages = {2486--2495},
  numpages = {10},
  url = {http://dx.doi.org/10.1016/j.asoc.2012.03.039},
  doi = {10.1016/j.asoc.2012.03.039},
  acmid = {2240421},
  publisher = {Elsevier Science Publishers B. V.},
  address = {Amsterdam, The Netherlands, The Netherlands},
  keywords = {Character recognition, Feature combination, MPCA, PCA, SVM, Statistical, Topological},
}

cmaterdb / bangla(デフォルト設定)

  • コンフィグの説明:CMATERdbバングラ数字

  • ダウンロードサイズ573.81 KiB

  • スプリット

スプリット
'test' 1,000
'train' 5,000

視覚化

cmaterdb / devanagari

  • コンフィグの説明:CMATERdbデーヴァナーガリー数字

  • ダウンロードサイズ275.29 KiB

  • スプリット

スプリット
'test' 500
'train' 2,500

視覚化

cmaterdb / telugu

  • コンフィグの説明:CMATERdbテルグ語数字

  • ダウンロードサイズ283.90 KiB

  • スプリット

スプリット
'test' 500
'train' 2,500

視覚化