user_libri_text

  • คำอธิบาย :

UserLibri เป็นชุดข้อมูลที่จับคู่การถอดเสียงและข้อมูลเฉพาะข้อความเพิ่มเติมสำหรับผู้ใช้แต่ละรายจากทั้งหมด 107 คน เป็นการจัดรูปแบบใหม่ของชุดข้อมูล LibriSpeech ซึ่งพบได้ที่ http://www.openslr.org/12 โดย จัดระเบียบข้อมูลใหม่เป็นผู้ใช้โดยมีการเปล่งเสียง LibriSpeech เฉลี่ย 52 รายการและประโยคตัวอย่างข้อความประมาณ 6,700 ประโยคต่อผู้ใช้ คลาส UserLibriAudio ให้การเข้าถึงคู่การถอดเสียง ดู UserLibriText สำหรับข้อมูลเพิ่มเติม

แยก ตัวอย่าง
'10136' 38,496
'1041' 970
'10540' 3,283
'108' 5,864
'11' 1,348
'11667' 3,312
'1184' 22,062
'12176' 1,467
'12434' 2,796
'12544' 4,080
'13110' 2,634
'13158' 3,440
'13441' 4,145
'135' 37,263
'1353' 4,889
'1399' 18,914
'14420' 6,950
'14566' 3,810
'1477' 2,526
'14958' 1,495
'15263' 21,085
'15265' 7,647
'1549' 5,439
'1572' 2,882
'1597' 3,586
'1608' 3,605
'16127' 3,588
'16653' 7,600
'18096' 2,384
'1827' 4,806
'19019' 3,248
'19215' 13,542
'19717' 3,762
'1989' 1,105
'1998' 8,923
'20019' 966
'2002' 239
'20212' 3,363
'209' 2,090
'21297' 4,165
'22002' 4,044
'2300' 22,201
'24' 3,537
'24585' 1,789
'24811' 2,399
'2488' 8,239
'2529' 3,934
'26177' 3,598
'26379' 379
'2681' 8,872
'27067' 3,149
'27090' 3,217
'2770' 3,750
'2787' 4,603
'28700' 5,547
'28725' 3,899
'28952' 2,909
'2981' 54,305
'3076' 7,124
'30905' 2,140
'3178' 8,454
'33' 3,569
'33800' 5,145
'3436' 5,899
'3440' 5,087
'3441' 6,042
'36508' 521
'3748' 4,767
'38675' 2,696
'38804' 5,653
'39159' 2,729
'4028' 9,633
'40359' 7,821
'41326' 6,181
'4217' 6,003
'4276' 10,461
'434' 4,319
'4602' 4,421
'507' 9,093
'540' 5,452
'5516' 4,963
'5630' 1,130
'574' 452
'5921' 6,040
'6328' 5,926
'6812' 5,839
'732' 22,971
'76' 6,454
'7891' 1,476
'8166' 3,190
'820' 11,054
'833' 3,638
'9189' 8,387
'94' 1,722
'940' 6,172
'9464' 1,695
'955' 3,051
'969' 7,799
'9983' 8,898
  • โครงสร้างคุณลักษณะ :
FeaturesDict({
    'book_id': Text(shape=(), dtype=string),
    'text': Text(shape=(), dtype=string),
})
  • เอกสารคุณสมบัติ :
ลักษณะเฉพาะ ระดับ รูปร่าง Dประเภท คำอธิบาย
คุณสมบัติDict
book_id ข้อความ สตริง หนังสือที่ดึงข้อความนี้มาจาก
ข้อความ ข้อความ สตริง ประโยคข้อความที่ดึงมาจากหนังสือ
  • การอ้างอิง :
@inproceedings{breiner2022userlibri,
  title={UserLibri: A Dataset for ASR Personalization Using Only Text},
  author={Breiner, Theresa and Ramaswamy, Swaroop and Variani, Ehsan and Garg, Shefali and Mathews, Rajiv and Sim, Khe Chai and Gupta, Kilol and Chen, Mingqing and McConnaughey, Lara},
  booktitle={Proc. Interspeech 2022},
  year={2022}
}