Lotus CaLLii

ฐานข้อมูลเสียงพูดภาษาไทย บันทึกผ่านระบบคอลเซ็นเตอร์ที่เข้ารหัสสัญญาณเสียงแบบ mu-law พัฒนาขึ้นเพื่อใช้ในงานวิจัยและพัฒนาระบบระบุช่วงเวลาพูดของแต่ละบุคคล (Speaker Diarization System) และระบบรู้จำบุคคลจากเสียง (Speaker Recognition System) เนื้อหาของเสียงพูดเกี่ยวกับการแพทย์และการท่องเที่ยวโดยใช้ข้อมูลสมมติทั้งหมด เสียงพูดมาจากอาสาสมัคร 186 คน โดยมีอักษรย่อ F แทนผู้หญิง และ M แทนผู้ชาย จากแหล่งข้อมูล 4 แหล่ง ความยาวรวมทั้งสิ้น 3,863 นาที

ข้อมูลและทรัพยากร

This dataset has no data

ข้อมูลเพิ่มเติม

ฟิลด์ ค่า
* ประเภทชุดข้อมูล ข้อมูลประเภทอื่นๆ
คลังข้อมูลเสียงที่บันทึกผ่านระบบโทรศัพท์คอลเซ็นเตอร์
ยินยอมให้นำชื่อชุดข้อมูลไปใช้ที่ GD-Catalog ยินยอม
* ชื่อฝ่ายงานสำหรับติดต่อ เลขานุการคณะทำงานบริกรข้อมูล
* อีเมลสำหรับติดต่อ ds-sec@nstda.or.th
* วัตถุประสงค์ อื่นๆ
พัฒนาระบบปัญญาประดิษฐ์การประมวลผลสัญญาณเสียงพูด
* หน่วยความถี่ของการปรับปรุงข้อมูล ไม่ทราบ
ค่าความถี่ของการปรับปรุงข้อมูล (ความถี่น้อยที่สุด)
* ขอบเขตเชิงภูมิศาสตร์หรือเชิงพื้นที่ ประเทศ
* แหล่งที่มา เนคเทค
* รูปแบบการเก็บข้อมูล Audio
* หมวดหมู่ข้อมูลตามธรรมาภิบาลข้อมูลภาครัฐ ข้อมูลสาธารณะ
ระดับชั้นข้อมูล
* สัญญาอนุญาตให้ใช้ข้อมูล อื่นๆ
ฺCC 4.0 BY SA NC
เงื่อนไขในการเข้าถึงข้อมูล ต้องกรอกข้อมูลให้ครบถ้วน ส่งให้ผู้ดูแลข้อมูลพิจารณา หากผ่านเกณฑ์พิจารณาจะได้รหัสผ่านในการเปิดไฟล์
ผู้สนับสนุนหรือผู้ร่วมดำเนินการ หน่วยงานเอกชน
หน่วยที่ย่อยที่สุดของการจัดเก็บข้อมูล
URL https://aiforthai.in.th/corpus.php
ภาษาที่ใช้ ไทย
วันที่เริ่มต้นสร้าง 3 พฤษภาคม 2565
วันที่ปรับปรุงข้อมูลล่าสุด 14 กันยายน 2565
ชุดข้อมูลที่มีคุณค่าสูง
ข้อมูลอ้างอิง
สร้างโดย การนำเข้าโดย templete
สร้างในระบบเมื่อ 2 สิงหาคม 2567
ปรับปรุงครั้งล่าสุดในระบบเมื่อ 2 สิงหาคม 2567