Mfcc

Mfcc คลาสสุดท้ายสาธารณะ

แปลงสเปกโตรแกรมให้เป็นรูปแบบที่มีประโยชน์สำหรับการรู้จำคำพูด

ค่าสัมประสิทธิ์เซปสตรัลความถี่เมลเป็นวิธีหนึ่งในการแสดงข้อมูลเสียงที่มีประสิทธิภาพในฐานะฟีเจอร์อินพุตสำหรับแมชชีนเลิร์นนิง พวกมันถูกสร้างขึ้นโดยการใช้สเปกตรัมของสเปกตรัม ('เซปสตรัม') และละทิ้งความถี่ที่สูงกว่าบางส่วนซึ่งมีความสำคัญน้อยกว่าต่อหูของมนุษย์ พวกเขามีประวัติศาสตร์อันยาวนานในโลกแห่งการรู้จำเสียง และ https://en.wikipedia.org/wiki/Mel-frequency_cepstrum เป็นแหล่งข้อมูลที่ดีในการเรียนรู้เพิ่มเติม

คลาสที่ซ้อนกัน

ระดับ Mfcc.ตัวเลือก แอ็ตทริบิวต์ทางเลือกสำหรับ Mfcc

ค่าคงที่

สตริง OP_NAME ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow

วิธีการสาธารณะ

เอาท์พุต < TFloat32 >
เป็นเอาท์พุต ()
ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์
Mfcc แบบคงที่
สร้าง (ขอบเขต ขอบเขต ตัวดำเนินการ < TFloat32 > สเปกโตรแกรม ตัวดำเนินการ < TInt32 > SampleRate ตัวเลือก... ตัวเลือก)
วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ Mfcc ใหม่
Mfcc.Options แบบคงที่
dctCoefficientCount (dctCoefficientCount แบบยาว)
Mfcc.Options แบบคงที่
filterbankChannelCount (กรองยาว BankChannelCount)
Mfcc.Options แบบคงที่
lowerFrequencyLimit (ลอยต่ำกว่าFrequencyLimit)
เอาท์พุต < TFloat32 >
Mfcc.Options แบบคงที่
upperFrequencyLimit (ลอยบนFrequencyLimit)

วิธีการสืบทอด

org.tensorflow.op.RawOp
บูลีนสุดท้าย
เท่ากับ (วัตถุ obj)
int สุดท้าย
การดำเนินการ
สหกรณ์ ()
ส่งกลับหน่วยการคำนวณนี้เป็นการ Operation เดียว
สตริงสุดท้าย
บูลีน
เท่ากับ (วัตถุ arg0)
คลาสสุดท้าย<?>
รับคลาส ()
ภายใน
แฮชโค้ด ()
โมฆะสุดท้าย
แจ้ง ()
โมฆะสุดท้าย
แจ้งทั้งหมด ()
สตริง
toString ()
โมฆะสุดท้าย
รอสักครู่ (ยาว arg0, int arg1)
โมฆะสุดท้าย
รอ (ยาว arg0)
โมฆะสุดท้าย
รอ ()
ซ org.tensorflow.op.Op
บทคัดย่อ ExecutionEnvironment
สิ่งแวดล้อม ()
ส่งคืนสภาพแวดล้อมการดำเนินการที่ op นี้ถูกสร้างขึ้น
การดำเนินการ ที่เป็นนามธรรม
สหกรณ์ ()
ส่งกลับหน่วยการคำนวณนี้เป็นการ Operation เดียว
เฟซ org.tensorflow.Operand
เอาต์พุต นามธรรม < TFloat32 >
เป็นเอาท์พุต ()
ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์
นามธรรม TFloat32
แอสเทนเซอร์ ()
ส่งกลับเทนเซอร์ที่ตัวถูกดำเนินการนี้
รูปร่าง นามธรรม
รูปร่าง ()
ส่งกลับรูปร่าง (อาจทราบได้บางส่วน) ของเทนเซอร์ที่อ้างอิงโดย Output ของตัวถูกดำเนินการนี้
คลาสนามธรรม < TFloat32 >
พิมพ์ ()
ส่งกลับประเภทเทนเซอร์ของตัวถูกดำเนินการนี้
เฟซ org.tensorflow.ndarray.Shaped
บทคัดย่อ
รูปร่าง นามธรรม
ยาวเป็นนามธรรม
ขนาด ()
คำนวณและส่งกลับขนาดรวมของคอนเทนเนอร์นี้เป็นจำนวนค่า

ค่าคงที่

สตริงสุดท้ายแบบคงที่สาธารณะ OP_NAME

ชื่อของ op นี้ ซึ่งรู้จักกันในชื่อของเอ็นจิ้นหลัก TensorFlow

ค่าคงที่: "Mfcc"

วิธีการสาธารณะ

เอาท์พุท สาธารณะ < TFloat32 > asOutput ()

ส่งกลับค่าแฮนเดิลสัญลักษณ์ของเทนเซอร์

อินพุตสำหรับการดำเนินการ TensorFlow คือเอาต์พุตของการดำเนินการ TensorFlow อื่น วิธีการนี้ใช้เพื่อรับหมายเลขอ้างอิงสัญลักษณ์ที่แสดงถึงการคำนวณอินพุต

การสร้าง Mfcc แบบคงที่สาธารณะ (ขอบเขต ขอบเขต ตัวดำเนินการ < TFloat32 > สเปกโตรแกรม ตัวดำเนินการ < TInt32 > ตัวอย่างเรต ตัวเลือก... ตัวเลือก)

วิธีการจากโรงงานเพื่อสร้างคลาสที่รวมการดำเนินการ Mfcc ใหม่

พารามิเตอร์
ขอบเขต ขอบเขตปัจจุบัน
สเปกโตรแกรม โดยทั่วไปแล้วจะผลิตโดย Spectrogram op โดยตั้งค่า magnitude_squared ให้เป็นจริง
อัตราตัวอย่าง เสียงต้นฉบับที่ใช้มีตัวอย่างกี่ตัวอย่างต่อวินาที
ตัวเลือก มีค่าแอตทริบิวต์ทางเลือก
การส่งคืน
  • อินสแตนซ์ใหม่ของ Mfcc

Mfcc.Options สาธารณะคงที่ dctCoefficientCount (dctCoefficientCount แบบยาว)

พารามิเตอร์
dctค่าสัมประสิทธิ์การนับ จำนวนช่องสัญญาณเอาท์พุตที่จะสร้างต่อการแบ่งเวลา

Mfcc.Options สาธารณะคง filterbankChannelCount (กรองยาว BankChannelCount)

พารามิเตอร์
filterbankChannelCount ความละเอียดของธนาคาร Mel ที่ใช้ภายใน

Mfcc.Options คงที่สาธารณะ lowerFrequencyLimit (Float lowerFrequencyLimit)

พารามิเตอร์
ขีดจำกัดความถี่ที่ต่ำกว่า ความถี่ต่ำสุดที่จะใช้เมื่อคำนวณ ceptstrum

เอาท์พุท สาธารณะ < TFloat32 > เอาท์พุท ()

Mfcc.Options คงที่สาธารณะ upperFrequencyLimit (Float upperFrequencyLimit)

พารามิเตอร์
ขีดจำกัดความถี่บน ความถี่สูงสุดที่จะใช้เมื่อคำนวณ ceptstrum