Meta releases AI model that can check other AI models’ work

นิวยอร์ก, 18 ตุลาคม – Meta บริษัทเจ้าของ Facebook ประกาศเมื่อวันศุกร์ว่า กำลังเปิดตัวโมเดล AI ชุดใหม่จากแผนกวิจัย รวมถึง “Self-Taught Evaluator” ซึ่งอาจเป็นแนวทางสู่การลดการมีส่วนร่วมของมนุษย์ในกระบวนการพัฒนา AI

NEW YORK, Oct 18 – Facebook owner Meta said on Friday it was releasing a batch of new AI models from its research division, including a “Self-Taught Evaluator” that may offer a path toward less human involvement in the AI development process.

Meta เปิดตัวโมเดล AI ที่สามารถตรวจสอบการทำงานของโมเดล AI อื่นๆ

นิวยอร์ก, 18 ตุลาคม – Meta บริษัทเจ้าของ Facebook ประกาศเมื่อวันศุกร์ว่า กำลังเปิดตัวโมเดล AI ชุดใหม่จากแผนกวิจัย รวมถึง “Self-Taught Evaluator” ซึ่งอาจเป็นแนวทางสู่การลดการมีส่วนร่วมของมนุษย์ในกระบวนการพัฒนา AI

การเปิดตัวนี้เกิดขึ้นหลังจาก Meta ได้แนะนำเครื่องมือนี้ในบทความเมื่อเดือนสิงหาคม ซึ่งอธิบายรายละเอียดว่าใช้เทคนิค “chain of thought” เช่นเดียวกับที่ใช้ในโมเดล o1 ที่ OpenAI เพิ่งเปิดตัว เพื่อให้สามารถตัดสินการตอบสนองของโมเดลได้อย่างน่าเชื่อถือ

เทคนิคดังกล่าวเกี่ยวข้องกับการแยกปัญหาที่ซับซ้อนออกเป็นขั้นตอนทางตรรกะที่เล็กลง และดูเหมือนจะช่วยปรับปรุงความแม่นยำของการตอบสนองต่อปัญหาที่ท้าทายในหัวข้อต่างๆ เช่น วิทยาศาสตร์ การเขียนโค้ด และคณิตศาสตร์

นักวิจัยของ Meta ใช้ข้อมูลที่สร้างขึ้นทั้งหมดโดย AI เพื่อฝึกฝนโมเดลประเมินผล ซึ่งขจัดการป้อนข้อมูลจากมนุษย์ในขั้นตอนนั้นด้วย

ความสามารถในการใช้ AI เพื่อประเมิน AI อย่างน่าเชื่อถือ แสดงให้เห็นถึงแนวทางที่เป็นไปได้ในการสร้างตัวแทน AI อัตโนมัติที่สามารถเรียนรู้จากข้อผิดพลาดของตัวเอง ตามที่นักวิจัยสองคนของ Meta ผู้อยู่เบื้องหลังโครงการนี้กล่าวกับ Reuters

หลายคนในวงการ AI มองว่าตัวแทนดังกล่าวเป็นผู้ช่วยดิจิทัลที่ฉลาดพอที่จะทำงานได้หลากหลายโดยไม่ต้องมีการแทรกแซงจากมนุษย์

โมเดลที่สามารถพัฒนาตัวเองได้อาจขจัดความจำเป็นในกระบวนการที่มักมีราคาแพงและไม่มีประสิทธิภาพที่ใช้อยู่ในปัจจุบัน เรียกว่า Reinforcement Learning from Human Feedback ซึ่งต้องอาศัยข้อมูลจากผู้จดบันทึกที่เป็นมนุษย์ ซึ่งต้องมีความเชี่ยวชาญเฉพาะทางในการติดฉลากข้อมูลอย่างถูกต้องและตรวจสอบว่าคำตอบสำหรับคำถามคณิตศาสตร์และการเขียนที่ซับซ้อนนั้นถูกต้อง

“เราหวังว่าเมื่อ AI กลายเป็นสิ่งที่เหนือกว่ามนุษย์มากขึ้นเรื่อยๆ มันจะสามารถตรวจสอบงานของตัวเองได้ดีขึ้นและดีขึ้น จนกระทั่งดีกว่ามนุษย์ทั่วไป” Jason Weston หนึ่งในนักวิจัยกล่าว

“แนวคิดเรื่องการเรียนรู้ด้วยตนเองและสามารถประเมินตนเองได้นั้น เป็นสิ่งสำคัญต่อแนวคิดในการพัฒนา AI ให้ถึงระดับที่เหนือกว่ามนุษย์” เขากล่าว

บริษัทอื่นๆ รวมถึง Google และ Anthropic ก็ได้เผยแพร่งานวิจัยเกี่ยวกับแนวคิด RLAIF หรือ Reinforcement Learning from AI Feedback เช่นกัน อย่างไรก็ตาม บริษัทเหล่านั้นมักไม่เปิดตัวโมเดลของตนเพื่อให้สาธารณชนใช้งาน

เครื่องมือ AI อื่นๆ ที่ Meta เปิดตัวเมื่อวันศุกร์ รวมถึงการอัปเดตโมเดล Segment Anything สำหรับการระบุภาพ เครื่องมือที่เพิ่มความเร็วในการสร้างการตอบสนองของ LLM และชุดข้อมูลที่สามารถใช้เพื่อช่วยในการค้นพบวัสดุอนินทรีย์ใหม่ๆ

view original*