Researchers Are Breaking Ancient Language Barriers With AI

นักวิทยาศาสตร์ด้านข้อมูลกำลังใช้ปัญญาประดิษฐ์เพื่อแปล Cuneiform และ Akkadian เป็นภาษาอังกฤษ

Data scientists are using artificial intelligence to translate Cuneiform and Akkadian into English.

นักวิจัยกำลังทำลายกำแพงภาษาโบราณด้วย AI

การถอดรหัสภาษาและข้อความโบราณเป็นสิ่งที่ท้าทายสำหรับนักโบราณคดีมาหลายชั่วอายุคน ขณะนี้ นักวิจัยกำลังใช้ปัญญาประดิษฐ์เพื่อแปลข้อความและภาษาโบราณเป็นภาษาอังกฤษอย่างรวดเร็ว ซึ่งรวมถึงอักษรคูนิฟอร์มโบราณ (ancient Cuneiform) และอักษรอียิปต์โบราณ (Egyptian hieroglyphs)

ในรายงาน Oxford Academic กลุ่มนักพัฒนา AI ให้รายละเอียดว่าพวกเขาสามารถใช้การประมวลผลภาษาธรรมชาติ (NLP) เพื่อแปลอักษรรูปลิ่มที่บันทึกบนแผ่นดินเหนียว cuneiform tablets จากภาษา Akkadian เป็นภาษาอังกฤษได้อย่างไร

“แผ่นดินเหนียวหลายแสนแผ่นที่จารึกอักษรรูปลิ่ม บันทึกประวัติศาสตร์ทางการเมือง สังคม เศรษฐกิจ และวิทยาศาสตร์ของเมโสโปเตเมียโบราณ” รายงานระบุ “ถึงกระนั้น เอกสารเหล่านี้ส่วนใหญ่ยังคงไม่ได้รับการแปล และไม่สามารถเข้าถึงได้ เนื่องจากมีจำนวนผู้เชี่ยวชาญที่สามารถอ่านได้ในจำนวนจำกัด”

แต่การใช้ AI เพื่ออ่านข้อความโบราณนั้นไม่ง่ายเหมือนการเรียกใช้รูปภาพผ่านปลั๊กอิน ChatGPT

“ความท้าทายหลักสำหรับเราคือการขาดข้อมูลจำนวนมาก” Gai Gutherz ผู้ร่วมเขียนรายงานกล่าว “มีข้อมูลเพียงเล็กน้อย ที่คุณสามารถใช้ในการฝึกโมเดล เราจัดการเพื่อให้ได้ตัวอย่าง [ของข้อมูล] นับหมื่น”


Gutherz วิศวกรซอฟต์แวร์ของ Google กล่าวว่าแม้ว่าการแปลภาษาอัคคาเดียนจะพิสูจน์ได้ว่ามีความท้าทายมากกว่าภาษาสเปน แต่ก็มีข้อมูลจำนวนมากที่ต้องดึงออกมา เนื่องจากเป็นภาษาที่ใช้พูดและเขียนกันอย่างแพร่หลายในสมัยนั้น

“อัคคาเดียนเป็นภาษาที่สำคัญมาก มันเป็นภาษากลางในตะวันออกกลางและเมโสโปเตเมียเก่า” กูเธอร์ซกล่าว “ผู้คนในเมโสโปเตเมียพูดภาษาต่างๆ และใช้ภาษาอัคคาเดียนในการสื่อสาร ซึ่งใช้เป็นภาษาอังกฤษในปัจจุบัน”

ในขณะเดียวกัน อักษรรูปลิ่ม (Cuneiform) มีต้นกำเนิดประมาณ 3,400 ปีก่อนคริสตศักราชและเป็นหนึ่งในระบบการเขียนที่เก่าแก่ที่สุดที่ใช้ในการบันทึกภาษาถิ่นโบราณหลายภาษารวมถึง Sumerian, Akkadian, Hittite, Aramaic และ Old Persian

งานวรรณกรรมที่เก่าแก่ที่สุดที่ยังหลงเหลืออยู่คือ Epic of Gilgamesh ซึ่งค้นพบในปี พ.ศ. 2396 เขียนขึ้นเมื่อ 4,000 ปีก่อนในภาษาอัคคาเดียนโดยใช้อักษรรูปลิ่ม

ในเดือนพฤษภาคม ทีมวิจัยของอิตาลีได้ตีพิมพ์บทความเกี่ยวกับวิธีการใช้ AI เพื่อตรวจจับโบราณสถานสำหรับการค้นพบทางโบราณคดีในที่ราบน้ำท่วมถึงเมโสโปเตเมีย เมื่อต้นเดือนที่ผ่านมา นักวิจัยใช้ AI เพื่อค้นพบ geoglyphs Nasca ซึ่งเป็นภาพแกะสลักของมนุษย์และสัตว์ในเปรู


อีกโครงการที่ต้องการช่วยให้นักวิจัยสมัยใหม่เข้าใจภาษาและข้อความโบราณคือ Google Fabricius โดย Fabricius ช่วยถอดรหัสอักษรอียิปต์โบราณเป็นภาษาอังกฤษโดยใช้เครื่องมือออนไลน์ที่พัฒนาโดยยักษ์ใหญ่ด้านเทคโนโลยี

“วิธีที่ง่ายที่สุดในการทำความเข้าใจอักษรอียิปต์โบราณคือการจินตนาการว่าพวกมันเทียบเท่ากับอิโมจิของอียิปต์โบราณ” Fabricius กล่าว

รายงานของอ็อกซ์ฟอร์ดกล่าวว่าปัญหาในการแปลข้อความโบราณเหล่านี้คือการหาแผ่นจารึกที่สมบูรณ์ โดยกล่าวว่าเม็ดดินเหนียวไม่ค่อยได้รับการเก็บรักษาไว้อย่างครบถ้วน และเป็นผลให้การแปลด้วยเครื่อง neural machine translation ก็เช่นเดียวกับการแปลโดยมนุษย์ ที่ต้องเผชิญกับปัญหา ข้อมูลขาดบริบท ไม่ครบถ้วนเพียงพอ

Gutherz กล่าวว่า “เมื่อเปรียบเทียบกับภาษาที่เก่าแก่ และสูญพันธุ์ไปแล้วกว่า 2,000 ปี เราก็ยังมีตัวอย่างมากมาย “ที่ช่วยให้ทำงานได้ง่ายขึ้น โดยมีข้อความที่แปลแล้วหลายสิบรายการ”

นักวิจัยที่ทำงานร่วมกับ Gutherz ได้พัฒนาเว็บไซต์ The Babylonian Engine เพื่อแสดงเทคโนโลยีของพวกเขา แม้ว่าชื่ออาจฟังดูเหมือนเจ้าหุ่นยนต์ชั่วร้ายในนิยายไซเบอร์พังก์ แต่โปรเจกต์นี้มีเป้าหมายที่จะดำเนินการแปลภาษาโบราณต่างๆ โดยเริ่มจากภาษาอัคคาเดียน

ตามที่ Gutherz อธิบาย โมเดลที่ใช้ในการฝึก Babylonian Engine AI หรือที่เรียกว่า Akkademia เป็นโอเพ่นซอร์สและสามารถดูได้ใน Github ของโครงการ


“เรามีอะไรให้เรียนรู้มากมายจากประวัติศาสตร์สมัยโบราณ จดหมายและหนังสือเล่มแรกเขียนด้วยภาษาอัคคาเดียนและภาษาโบราณอื่นๆ” กูเธอร์ซกล่าว “ฉันคิดว่ามันน่าสนใจมากที่พยายามทำให้มันเข้าถึงได้มากขึ้นและแปล [อัคคาเดียน] เป็นภาษาอังกฤษและภาษาอื่นๆ ที่ผู้คนพูดกันในปัจจุบัน”

view original *