cmaterdb

  • 설명 :

이 데이터세트에는 - 손으로 쓴 벵골어 숫자 - 총 6000개의 벵골어 숫자(32x32 RGB 컬러, 6000개 이미지)의 균형 잡힌 데이터세트가 포함되어 있으며, 각각 클래스당(자리당) 600개의 이미지가 있습니다. 손으로 쓴 데바나가리 숫자 - 총 3000개의 데바나가리 숫자(32x32 RGB 컬러, 3000개의 이미지)로 구성된 균형 잡힌 데이터세트로, 각 숫자에는 클래스당(자리당) 300개의 이미지가 있습니다. 손으로 쓴 텔루구 숫자 - 총 3000개의 텔루구 숫자(32x32 RGB 컬러, 3000개의 이미지)로 구성된 균형 잡힌 데이터세트로, 각 숫자에는 클래스당(자리당) 300개의 이미지가 있습니다.

CMATERdb는 인도 Jadavpur 대학교의 'CMATER(Centre for Microprocessor Application for Training Education and Research)' 연구소에서 만든 패턴 인식 데이터베이스 저장소입니다.

FeaturesDict({
    'image': Image(shape=(32, 32, 3), dtype=uint8),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • 기능 문서 :
특징 수업 모양 Dtype 설명
특징Dict
영상 영상 (32, 32, 3) uint8
상표 클래스 라벨 정수64
@article{Das:2012:GAB:2161007.2161320,
  author = {Das, Nibaran and Sarkar, Ram and Basu, Subhadip and Kundu, Mahantapas
            and Nasipuri, Mita and Basu, Dipak Kumar},
  title = {A Genetic Algorithm Based Region Sampling for Selection of Local Features
          in Handwritten Digit Recognition Application},
  journal = {Appl. Soft Comput.},
  issue_date = {May, 2012},
  volume = {12},
  number = {5},
  month = may,
  year = {2012},
  issn = {1568-4946},
  pages = {1592--1606},
  numpages = {15},
  url = {http://dx.doi.org/10.1016/j.asoc.2011.11.030},
  doi = {10.1016/j.asoc.2011.11.030},
  acmid = {2161320},
  publisher = {Elsevier Science Publishers B. V.},
  address = {Amsterdam, The Netherlands, The Netherlands},
  keywords = {Feature selection, Genetic algorithm, N-Quality consensus,
  Optimal local regions, Region sampling, Variable sized local regions},
}
@article{Das:2012:SFC:2240301.2240421,
  author = {Das, Nibaran and Reddy, Jagan Mohan and Sarkar, Ram and Basu, Subhadip and Kundu,
            Mahantapas and Nasipuri, Mita and Basu, Dipak Kumar},
  title = {A Statistical-topological Feature Combination for Recognition of Handwritten Numerals},
  journal = {Appl. Soft Comput.},
  issue_date = {August, 2012},
  volume = {12},
  number = {8},
  month = aug,
  year = {2012},
  issn = {1568-4946},
  pages = {2486--2495},
  numpages = {10},
  url = {http://dx.doi.org/10.1016/j.asoc.2012.03.039},
  doi = {10.1016/j.asoc.2012.03.039},
  acmid = {2240421},
  publisher = {Elsevier Science Publishers B. V.},
  address = {Amsterdam, The Netherlands, The Netherlands},
  keywords = {Character recognition, Feature combination, MPCA, PCA, SVM, Statistical, Topological},
}

cmaterdb/bangla (기본 구성)

  • 구성 설명 : CMATERdb Bangla Numerals

  • 다운로드 크기 : 573.81 KiB

  • 데이터세트 크기 : 1.71 MiB

  • 분할 :

나뉘다
'test' 1,000
'train' 5,000

심상

cmaterdb/devanagari

  • 구성 설명 : CMATERdb Devangari Numerals

  • 다운로드 크기 : 275.29 KiB

  • 데이터세트 크기 : 869.50 KiB

  • 분할 :

나뉘다
'test' 500
'train' 2,500

심상

cmaterdb/텔루구어

  • 구성 설명 : CMATERdb Telugu Numerals

  • 다운로드 크기 : 283.90 KiB

  • 데이터세트 크기 : 860.47 KiB

  • 분할 :

나뉘다
'test' 500
'train' 2,500

심상