บริษัท Meta กำลังฝึกเครื่องมือปัญญาประดิษฐ์ text-to-speech technology มากกว่า 4,000 ภาษา โดยมีจุดประสงค์เพื่อการอนุรักษ์
For its artificial intelligence speech tool, Meta is processing over 4,000 languages with the aim of preservation.
![](http://34.126.175.50/wp-content/uploads/2023/05/IMG_9048.jpg)
Meta กำลังฝึก AI อนุรักษ์ภาษาจากพระคัมภีร์และดาต้าเซ็ตคัมภีร์อื่นๆ
บริษัทแม่ของ Facebook และ Instagram กล่าวว่าได้พัฒนาเทคโนโลยีแปลงข้อความเป็นคำพูด (text-to-speech technology) ที่ขับเคลื่อนด้วย AI ซึ่งสามารถระบุภาษาได้มากกว่า 4,000 ภาษา Meta กล่าวว่าเป้าหมายคือการรักษาภาษาของโลก และยักษ์ใหญ่ด้านเทคโนโลยีกำลังใช้คัมภีร์ไบเบิลและดาต้าเซ็ตทางความเชื่ออื่น ๆ
“การรวบรวมข้อมูลเสียงสำหรับภาษาต่างๆ นับพันเป็นความท้าทายแรกของเรา เนื่องจากชุดข้อมูลเสียงพูดที่ใหญ่ที่สุดที่มีอยู่ครอบคลุมมากที่สุด 100 ภาษา” Meta กล่าวในโพสต์ที่ประกาศโครงการ “เพื่อเอาชนะสิ่งนี้ เราหันไปหาข้อความทางศาสนา เช่น คัมภีร์ไบเบิล ซึ่งได้รับการแปลเป็นภาษาต่างๆ มากมาย และคำแปลที่ได้รับการศึกษาอย่างแพร่หลายสำหรับการวิจัยการแปลภาษาจากข้อความตัวอักษร”
ในเอกสารการวิจัยที่จัดทำโดยทีมงานหลักของ Meta AI บริษัทกล่าวว่าได้รับข้อมูลจากพระคัมภีร์ รวมถึงข้อความต้นฉบับและการบันทึกเสียงจาก FaithComesByHearing.com, GoTo.Bible และ Bible.com
โครงการนี้ประกอบด้วยการบันทึกเรื่องราวในพระคัมภีร์ ข้อความการประกาศ การอ่านพระคัมภีร์ และเพลงในภาษาและภาษาท้องถิ่นมากกว่า 6,255 ภาษา ในขณะที่ฟีเจอร์การบันทึกส่วนใหญ่มักเป็นของผู้อ่านผู้ชาย แต่ Meta กล่าวว่าโมเดลของ AI ทำงานได้ดีพอๆ กันสำหรับเสียงผู้หญิง
Meta กล่าวว่า ชุดข้อมูลการอ่านพันธสัญญาใหม่ ให้ข้อมูลมากกว่า 1,100 ภาษา โดยให้ข้อมูลเฉลี่ย 32 ชั่วโมงต่อภาษา
ตามศูนย์ภาษา Lingua ของ Broward College มีภาษาที่มีชีวิตมากกว่า 7,100 ภาษาทั่วโลก
“การปรึกษาหารือของเรากับนักจริยธรรมชาวคริสต์ได้ข้อสรุปว่าชาวคริสต์ส่วนใหญ่จะไม่ถือว่าพันธสัญญาใหม่ (The New Testament) และคำแปลนั้นศักดิ์สิทธิ์เกินกว่าที่จะใช้ในการเรียนรู้ด้วยเครื่อง” ทีม Meta AI กล่าว และเสริมว่าข้อความเดียวกันนี้ไม่เป็นความจริงสำหรับข้อความทางศาสนาทั้งหมด
“นอกจากนี้ยังมีความเสี่ยงที่ข้อมูลการฝึกอบรมทางศาสนาจะทำให้โมเดลมีอคติตามมุมมองของโลกที่เฉพาะเจาะจง” Meta AI กล่าว “อย่างไรก็ตาม การวิเคราะห์ภาษาที่สร้างขึ้นโดยแบบจำลองของเราแสดงให้เห็นว่าภาษาที่เกิดจากแบบจำลองการรู้จำเสียงที่เป็นผลลัพธ์นั้นมีอคติเพียงเล็กน้อยเมื่อเทียบกับแบบจำลองพื้นฐานที่ได้รับการฝึกฝนในโดเมนอื่นๆ”
หลังจากความทะเยอทะยานของ metaverse มอดลงเมื่อต้นปีนี้ Meta ดูเหมือนจะเปลี่ยนโฟกัสไปที่ปัญญาประดิษฐ์ ซึ่งรวมถึงการสร้างเครื่องมือ AI เพื่อระบุและแยกรายการในรูปภาพ และเครื่องมือที่ขับเคลื่อนด้วย AI เพื่อช่วยให้แบรนด์กำหนดเป้าหมายผู้ใช้บนแพลตฟอร์ม Facebook และ Instagram
ในขณะที่เทคโนโลยียังอยู่ในช่วงเริ่มต้น Meta กล่าวว่ากำลังเปิดซอร์สข้อมูลและโค้ดเพื่อให้ผู้อื่นสามารถสร้าง พัฒนา และปรับปรุงแพลตฟอร์มได้
“หลายภาษาของโลกกำลังตกอยู่ในอันตรายที่จะสูญหายไป และข้อจำกัดของการรู้จำเสียงและเทคโนโลยีการสร้างในปัจจุบันมีแต่จะเร่งให้แนวโน้มนี้เร็วขึ้น” Meta กล่าว “เราต้องการทำให้ผู้คนเข้าถึงข้อมูลและใช้อุปกรณ์ในภาษาที่พวกเขาต้องการได้ง่ายขึ้น และในวันนี้ เรากำลังประกาศชุดโมเดลปัญญาประดิษฐ์ที่สามารถช่วยให้พวกเขาทำเช่นนั้นได้”