AudioClassifier

کلاس نهایی کلاس عمومی عمومی AudioClassifier

طبقه بندی را بر روی شکل موج های صوتی انجام می دهد.

API انتظار دارد یک مدل TFLite با فراداده مدل TFLite باشد. .

API از مدل هایی با یک تانسور ورودی صوتی و یک تانسور خروجی طبقه بندی پشتیبانی می کند. برای دقیق تر، در اینجا الزامات وجود دارد.

  • تانسور صوتی ورودی ( kTfLiteFloat32 )
    • بافر صوتی ورودی با اندازه [batch x samples] .
    • استنتاج دسته ای پشتیبانی نمی شود ( batch باید 1 باشد).
  • تانسور امتیاز خروجی ( kTfLiteFloat32 )
نمونه ای از چنین مدلی و یک ابزار نمایشی CLI را ببینید تا به راحتی این API را امتحان کنید.

کلاس های تو در تو

کلاس AudioClassifier.AudioClassifierOptions گزینه هایی برای راه اندازی AudioClassifier .

روش های عمومی

فهرست < طبقه بندی ها >
طبقه بندی ( تانسور صوتی تنسور)
طبقه بندی واقعی را بر روی تانسور صوتی ارائه شده انجام می دهد.
ضبط صدا
ایجاد ضبط صدا ()
یک نمونه AudioRecord برای ضبط جریان صدا ایجاد می کند.
طبقه بندی کننده صوتی استاتیک
createFromBuffer ( ByteBuffer modelBuffer)
یک نمونه AudioClassifier با بافر مدل و AudioClassifier.AudioClassifierOptions پیش‌فرض ایجاد می‌کند.
طبقه بندی کننده صوتی استاتیک
createFromBufferAndOptions (گزینه های ByteBuffer modelBuffer، AudioClassifier.AudioClassifierOptions )
یک نمونه AudioClassifier با بافر مدل و AudioClassifier.AudioClassifierOptions ایجاد می کند.
طبقه بندی کننده صوتی استاتیک
createFromFile (زمینه زمینه، رشته modelPath)
یک نمونه AudioClassifier از AudioClassifier.AudioClassifierOptions پیش فرض ایجاد می کند.
طبقه بندی کننده صوتی استاتیک
createFromFile ( فایل modelFile)
یک نمونه AudioClassifier از AudioClassifier.AudioClassifierOptions پیش فرض ایجاد می کند.
طبقه بندی کننده صوتی استاتیک
createFromFileAndOptions (زمینه زمینه، رشته modelPath، گزینه های AudioClassifier.AudioClassifierOptions )
یک نمونه AudioClassifier از AudioClassifier.AudioClassifierOptions ایجاد می کند.
طبقه بندی کننده صوتی استاتیک
createFromFileAndOptions (گزینه های File modelFile، AudioClassifier.AudioClassifierOptions )
یک نمونه AudioClassifier ایجاد می کند.
TensorAudio
createInputTensorAudio ()
یک نمونه TensorAudio برای ذخیره نمونه های صوتی ورودی ایجاد می کند.
طولانی
getRequiredInputBufferSize ()
اندازه بافر ورودی مورد نیاز را به تعداد عناصر شناور برمی‌گرداند.
TensorAudio.TensorAudioFormat
getRequiredTensorAudioFormat ()
TensorAudio.TensorAudioFormat مورد نیاز مدل را برمی گرداند.

روش های ارثی

روش های عمومی

فهرست عمومی < طبقه بندی ها > طبقه بندی ( TensorAudio tensor)

طبقه بندی واقعی را بر روی تانسور صوتی ارائه شده انجام می دهد.

مولفه های
تانسور یک TensorAudio حاوی کلیپ صوتی ورودی به صورت شناور با مقادیر بین [-1، 1). آرگومان tensor باید همان اندازه مسطح تانسور ورودی مدل TFLite باشد. توصیه می شود با استفاده از روش createInputTensorAudio tensor ایجاد کنید.
پرتاب می کند
IllegalArgumentException اگر آرگومان نامعتبر باشد
IllegalStateException اگر هنگام طبقه بندی کلیپ صوتی از کد اصلی خطایی رخ دهد

ضبط صوتی عمومی ایجاد ضبط صوتی ()

یک نمونه AudioRecord برای ضبط جریان صدا ایجاد می کند. نمونه AudioRecord برگشتی مقدار دهی اولیه می شود و مشتری باید متد AudioRecord.startRecordingnull را برای شروع ضبط فراخوانی کند.

برمی گرداند
پرتاب می کند
IllegalArgumentException اگر تعداد کانال مورد نیاز مدل پشتیبانی نشود
IllegalStateException اگر نمونه AudioRecord راه اندازی نشد

عمومی استاتیک AudioClassifier createFromBuffer ( ByteBuffer modelBuffer)

یک نمونه AudioClassifier با بافر مدل و AudioClassifier.AudioClassifierOptions پیش‌فرض ایجاد می‌کند.

مولفه های
مدل بافر یک ByteBuffer مستقیم یا یک MappedByteBuffer از مدل طبقه بندی
پرتاب می کند
IllegalStateException اگر خطای داخلی وجود داشته باشد
RuntimeException اگر خطای نامشخص دیگری وجود داشته باشد
IllegalArgumentException اگر بافر مدل یک ByteBuffer مستقیم یا MappedByteBuffer نباشد

Public Static AudioClassifier createFromBufferAndOptions (گزینه های ByteBuffer modelBuffer، AudioClassifier.AudioClassifierOptions )

یک نمونه AudioClassifier با بافر مدل و AudioClassifier.AudioClassifierOptions ایجاد می کند.

مولفه های
مدل بافر یک ByteBuffer مستقیم یا یک MappedByteBuffer از مدل طبقه بندی
گزینه ها
پرتاب می کند
IllegalStateException اگر خطای داخلی وجود داشته باشد
RuntimeException اگر خطای نامشخص دیگری وجود داشته باشد
IllegalArgumentException اگر بافر مدل یک ByteBuffer مستقیم یا MappedByteBuffer نباشد

عمومی استاتیک AudioClassifier createFromFile (زمینه زمینه، رشته مدلPath)

یک نمونه AudioClassifier از AudioClassifier.AudioClassifierOptions پیش فرض ایجاد می کند.

مولفه های
متن نوشته
modelPath مسیر مدل طبقه بندی با ابرداده در دارایی ها
پرتاب می کند
IOException اگر هنگام بارگذاری مدل tflite خطای I/O رخ دهد
IllegalArgumentException اگر آرگومان نامعتبر باشد
IllegalStateException اگر خطای داخلی وجود داشته باشد
RuntimeException اگر خطای نامشخص دیگری وجود داشته باشد

Public Static AudioClassifier createFromFile ( فایل modelFile)

یک نمونه AudioClassifier از AudioClassifier.AudioClassifierOptions پیش فرض ایجاد می کند.

مولفه های
modelFile مدل طبقه بندی نمونه File
پرتاب می کند
IOException اگر هنگام بارگذاری مدل tflite خطای I/O رخ دهد
IllegalArgumentException اگر آرگومان نامعتبر باشد
IllegalStateException اگر خطای داخلی وجود داشته باشد
RuntimeException اگر خطای نامشخص دیگری وجود داشته باشد

Public Static AudioClassifier createFromFileAndOptions (زمینه زمینه، رشته مدلPath، گزینه AudioClassifier.AudioClassifierOptions )

یک نمونه AudioClassifier از AudioClassifier.AudioClassifierOptions ایجاد می کند.

مولفه های
متن نوشته
modelPath مسیر مدل طبقه بندی با ابرداده در دارایی ها
گزینه ها
پرتاب می کند
IOException اگر هنگام بارگذاری مدل tflite خطای I/O رخ دهد
IllegalArgumentException اگر آرگومان نامعتبر باشد
IllegalStateException اگر خطای داخلی وجود داشته باشد
RuntimeException اگر خطای نامشخص دیگری وجود داشته باشد

Public Static AudioClassifier createFromFileAndOptions (گزینه های File modelFile، AudioClassifier.AudioClassifierOptions )

یک نمونه AudioClassifier ایجاد می کند.

مولفه های
modelFile مدل طبقه بندی نمونه File
گزینه ها
پرتاب می کند
IOException اگر هنگام بارگذاری مدل tflite خطای I/O رخ دهد
IllegalArgumentException اگر آرگومان نامعتبر باشد
IllegalStateException اگر خطای داخلی وجود داشته باشد
RuntimeException اگر خطای نامشخص دیگری وجود داشته باشد

عمومی TensorAudio createInputTensorAudio ()

یک نمونه TensorAudio برای ذخیره نمونه های صوتی ورودی ایجاد می کند.

برمی گرداند
  • یک TensorAudio با اندازه تانسور ورودی مدل
پرتاب می کند
IllegalArgumentException اگر مدل سازگار نیست

عمومی طولانی getRequiredInputBufferSize ()

اندازه بافر ورودی مورد نیاز را به تعداد عناصر شناور برمی‌گرداند.

عمومی TensorAudio.TensorAudioFormat getRequiredTensorAudioFormat ()

TensorAudio.TensorAudioFormat مورد نیاز مدل را برمی گرداند.