그잔

  • 설명 :

데이터 세트는 각 30초 길이의 1000개 오디오 트랙으로 구성됩니다. 여기에는 각각 100개의 트랙으로 표시되는 10개의 장르가 포함되어 있습니다. 트랙은 모두 .wav 형식의 22050Hz 모노 16비트 오디오 파일입니다.

장르는 다음과 같습니다.

나뉘다
'train' 1,000
  • 기능 구조 :
FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=10),
})
  • 기능 문서 :
특징 수업 모양 D타입 설명
풍모Dict
오디오 오디오 (없음,) int64
오디오/파일 이름 텍스트
상표 클래스 레이블 int64
  • 인용 :
@misc{tzanetakis_essl_cook_2001,
author    = "Tzanetakis, George and Essl, Georg and Cook, Perry",
title     = "Automatic Musical Genre Classification Of Audio Signals",
url       = "http://ismir2001.ismir.net/pdf/tzanetakis.pdf",
publisher = "The International Society for Music Information Retrieval",
year      = "2001"
}