TFDS는 이제 Croissant 🥐 형식을 지원합니다! 자세한 내용은 설명서를 읽어보세요.

이 페이지는 Cloud Translation API를 통해 번역되었습니다.

gtzan_music_speech

설명 :

데이터 세트는 음악/음성 식별을 위해 수집되었습니다. 데이터 세트는 각각 길이가 30초인 120개의 트랙으로 구성됩니다. 각 클래스(음악/스피치)에는 60개의 예제가 있습니다. 트랙은 모두 .wav 형식의 22050Hz 모노 16비트 오디오 파일입니다.

추가 문서 : 코드가 있는 논문에서 탐색
홈페이지 : http://marsyas.info/index.html
소스코드 : tfds.audio.gtzan_music_speech.GTZANMusicSpeech
버전 :
- 1.0.0 (기본값): 릴리스 정보가 없습니다.
다운로드 크기 : 283.29 MiB
데이터 세트 크기 : 424.64 MiB
자동 캐시 ( 문서 ): 아니요
분할 :

나뉘다	예
`'train'`	128

기능 구조 :

FeaturesDict({
    'audio': Audio(shape=(None,), dtype=int64),
    'audio/filename': Text(shape=(), dtype=string),
    'label': ClassLabel(shape=(), dtype=int64, num_classes=2),
})

기능 문서 :

특징	수업	모양	D타입	설명
	풍모Dict
오디오	오디오	(없음,)	int64
오디오/파일 이름	텍스트		끈
상표	클래스 레이블		int64

감독 키 ( as_supervised 문서 참조): ('audio', 'label')
그림 ( tfds.show_examples ): 지원되지 않습니다.
예 ( tfds.as_dataframe ):

인용 :

@ONLINE {Music Speech,
    author = "Tzanetakis, George",
    title  = "GTZAN Music/Speech Collection",
    year   = "1999",
    url    = "http://marsyas.info/index.html"
}

달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.

최종 업데이트: 2023-01-04(UTC)