Meta Is Training Its AI on the Bible and Other Religious Texts

บริษัท Meta กำลังฝึกเครื่องมือปัญญาประดิษฐ์ text-to-speech technology มากกว่า 4,000 ภาษา โดยมีจุดประสงค์เพื่อการอนุรักษ์

For its artificial intelligence speech tool, Meta is processing over 4,000 languages with the aim of preservation.

Meta กำลังฝึก AI อนุรักษ์ภาษาจากพระคัมภีร์และดาต้าเซ็ตคัมภีร์อื่นๆ

บริษัทแม่ของ Facebook และ Instagram กล่าวว่าได้พัฒนาเทคโนโลยีแปลงข้อความเป็นคำพูด (text-to-speech technology) ที่ขับเคลื่อนด้วย AI ซึ่งสามารถระบุภาษาได้มากกว่า 4,000 ภาษา Meta กล่าวว่าเป้าหมายคือการรักษาภาษาของโลก และยักษ์ใหญ่ด้านเทคโนโลยีกำลังใช้คัมภีร์ไบเบิลและดาต้าเซ็ตทางความเชื่ออื่น ๆ

“การรวบรวมข้อมูลเสียงสำหรับภาษาต่างๆ นับพันเป็นความท้าทายแรกของเรา เนื่องจากชุดข้อมูลเสียงพูดที่ใหญ่ที่สุดที่มีอยู่ครอบคลุมมากที่สุด 100 ภาษา” Meta กล่าวในโพสต์ที่ประกาศโครงการ “เพื่อเอาชนะสิ่งนี้ เราหันไปหาข้อความทางศาสนา เช่น คัมภีร์ไบเบิล ซึ่งได้รับการแปลเป็นภาษาต่างๆ มากมาย และคำแปลที่ได้รับการศึกษาอย่างแพร่หลายสำหรับการวิจัยการแปลภาษาจากข้อความตัวอักษร”

ในเอกสารการวิจัยที่จัดทำโดยทีมงานหลักของ Meta AI บริษัทกล่าวว่าได้รับข้อมูลจากพระคัมภีร์ รวมถึงข้อความต้นฉบับและการบันทึกเสียงจาก FaithComesByHearing.com, GoTo.Bible และ Bible.com

โครงการนี้ประกอบด้วยการบันทึกเรื่องราวในพระคัมภีร์ ข้อความการประกาศ การอ่านพระคัมภีร์ และเพลงในภาษาและภาษาท้องถิ่นมากกว่า 6,255 ภาษา ในขณะที่ฟีเจอร์การบันทึกส่วนใหญ่มักเป็นของผู้อ่านผู้ชาย แต่ Meta กล่าวว่าโมเดลของ AI ทำงานได้ดีพอๆ กันสำหรับเสียงผู้หญิง

Meta กล่าวว่า ชุดข้อมูลการอ่านพันธสัญญาใหม่ ให้ข้อมูลมากกว่า 1,100 ภาษา โดยให้ข้อมูลเฉลี่ย 32 ชั่วโมงต่อภาษา

ตามศูนย์ภาษา Lingua ของ Broward College มีภาษาที่มีชีวิตมากกว่า 7,100 ภาษาทั่วโลก

“การปรึกษาหารือของเรากับนักจริยธรรมชาวคริสต์ได้ข้อสรุปว่าชาวคริสต์ส่วนใหญ่จะไม่ถือว่าพันธสัญญาใหม่ (The New Testament) และคำแปลนั้นศักดิ์สิทธิ์เกินกว่าที่จะใช้ในการเรียนรู้ด้วยเครื่อง” ทีม Meta AI กล่าว และเสริมว่าข้อความเดียวกันนี้ไม่เป็นความจริงสำหรับข้อความทางศาสนาทั้งหมด

“นอกจากนี้ยังมีความเสี่ยงที่ข้อมูลการฝึกอบรมทางศาสนาจะทำให้โมเดลมีอคติตามมุมมองของโลกที่เฉพาะเจาะจง” Meta AI กล่าว “อย่างไรก็ตาม การวิเคราะห์ภาษาที่สร้างขึ้นโดยแบบจำลองของเราแสดงให้เห็นว่าภาษาที่เกิดจากแบบจำลองการรู้จำเสียงที่เป็นผลลัพธ์นั้นมีอคติเพียงเล็กน้อยเมื่อเทียบกับแบบจำลองพื้นฐานที่ได้รับการฝึกฝนในโดเมนอื่นๆ”

หลังจากความทะเยอทะยานของ metaverse มอดลงเมื่อต้นปีนี้ Meta ดูเหมือนจะเปลี่ยนโฟกัสไปที่ปัญญาประดิษฐ์ ซึ่งรวมถึงการสร้างเครื่องมือ AI เพื่อระบุและแยกรายการในรูปภาพ และเครื่องมือที่ขับเคลื่อนด้วย AI เพื่อช่วยให้แบรนด์กำหนดเป้าหมายผู้ใช้บนแพลตฟอร์ม Facebook และ Instagram

ในขณะที่เทคโนโลยียังอยู่ในช่วงเริ่มต้น Meta กล่าวว่ากำลังเปิดซอร์สข้อมูลและโค้ดเพื่อให้ผู้อื่นสามารถสร้าง พัฒนา และปรับปรุงแพลตฟอร์มได้

“หลายภาษาของโลกกำลังตกอยู่ในอันตรายที่จะสูญหายไป และข้อจำกัดของการรู้จำเสียงและเทคโนโลยีการสร้างในปัจจุบันมีแต่จะเร่งให้แนวโน้มนี้เร็วขึ้น” Meta กล่าว “เราต้องการทำให้ผู้คนเข้าถึงข้อมูลและใช้อุปกรณ์ในภาษาที่พวกเขาต้องการได้ง่ายขึ้น และในวันนี้ เรากำลังประกาศชุดโมเดลปัญญาประดิษฐ์ที่สามารถช่วยให้พวกเขาทำเช่นนั้นได้”

view original *