นิวยอร์ก, 18 ตุลาคม – Meta บริษัทเจ้าของ Facebook ประกาศเมื่อวันศุกร์ว่า กำลังเปิดตัวโมเดล AI ชุดใหม่จากแผนกวิจัย รวมถึง “Self-Taught Evaluator” ซึ่งอาจเป็นแนวทางสู่การลดการมีส่วนร่วมของมนุษย์ในกระบวนการพัฒนา AI
NEW YORK, Oct 18 – Facebook owner Meta said on Friday it was releasing a batch of new AI models from its research division, including a “Self-Taught Evaluator” that may offer a path toward less human involvement in the AI development process.
Meta เปิดตัวโมเดล AI ที่สามารถตรวจสอบการทำงานของโมเดล AI อื่นๆ
นิวยอร์ก, 18 ตุลาคม – Meta บริษัทเจ้าของ Facebook ประกาศเมื่อวันศุกร์ว่า กำลังเปิดตัวโมเดล AI ชุดใหม่จากแผนกวิจัย รวมถึง “Self-Taught Evaluator” ซึ่งอาจเป็นแนวทางสู่การลดการมีส่วนร่วมของมนุษย์ในกระบวนการพัฒนา AI
การเปิดตัวนี้เกิดขึ้นหลังจาก Meta ได้แนะนำเครื่องมือนี้ในบทความเมื่อเดือนสิงหาคม ซึ่งอธิบายรายละเอียดว่าใช้เทคนิค “chain of thought” เช่นเดียวกับที่ใช้ในโมเดล o1 ที่ OpenAI เพิ่งเปิดตัว เพื่อให้สามารถตัดสินการตอบสนองของโมเดลได้อย่างน่าเชื่อถือ
เทคนิคดังกล่าวเกี่ยวข้องกับการแยกปัญหาที่ซับซ้อนออกเป็นขั้นตอนทางตรรกะที่เล็กลง และดูเหมือนจะช่วยปรับปรุงความแม่นยำของการตอบสนองต่อปัญหาที่ท้าทายในหัวข้อต่างๆ เช่น วิทยาศาสตร์ การเขียนโค้ด และคณิตศาสตร์
นักวิจัยของ Meta ใช้ข้อมูลที่สร้างขึ้นทั้งหมดโดย AI เพื่อฝึกฝนโมเดลประเมินผล ซึ่งขจัดการป้อนข้อมูลจากมนุษย์ในขั้นตอนนั้นด้วย
ความสามารถในการใช้ AI เพื่อประเมิน AI อย่างน่าเชื่อถือ แสดงให้เห็นถึงแนวทางที่เป็นไปได้ในการสร้างตัวแทน AI อัตโนมัติที่สามารถเรียนรู้จากข้อผิดพลาดของตัวเอง ตามที่นักวิจัยสองคนของ Meta ผู้อยู่เบื้องหลังโครงการนี้กล่าวกับ Reuters
หลายคนในวงการ AI มองว่าตัวแทนดังกล่าวเป็นผู้ช่วยดิจิทัลที่ฉลาดพอที่จะทำงานได้หลากหลายโดยไม่ต้องมีการแทรกแซงจากมนุษย์
โมเดลที่สามารถพัฒนาตัวเองได้อาจขจัดความจำเป็นในกระบวนการที่มักมีราคาแพงและไม่มีประสิทธิภาพที่ใช้อยู่ในปัจจุบัน เรียกว่า Reinforcement Learning from Human Feedback ซึ่งต้องอาศัยข้อมูลจากผู้จดบันทึกที่เป็นมนุษย์ ซึ่งต้องมีความเชี่ยวชาญเฉพาะทางในการติดฉลากข้อมูลอย่างถูกต้องและตรวจสอบว่าคำตอบสำหรับคำถามคณิตศาสตร์และการเขียนที่ซับซ้อนนั้นถูกต้อง
“เราหวังว่าเมื่อ AI กลายเป็นสิ่งที่เหนือกว่ามนุษย์มากขึ้นเรื่อยๆ มันจะสามารถตรวจสอบงานของตัวเองได้ดีขึ้นและดีขึ้น จนกระทั่งดีกว่ามนุษย์ทั่วไป” Jason Weston หนึ่งในนักวิจัยกล่าว
“แนวคิดเรื่องการเรียนรู้ด้วยตนเองและสามารถประเมินตนเองได้นั้น เป็นสิ่งสำคัญต่อแนวคิดในการพัฒนา AI ให้ถึงระดับที่เหนือกว่ามนุษย์” เขากล่าว
บริษัทอื่นๆ รวมถึง Google และ Anthropic ก็ได้เผยแพร่งานวิจัยเกี่ยวกับแนวคิด RLAIF หรือ Reinforcement Learning from AI Feedback เช่นกัน อย่างไรก็ตาม บริษัทเหล่านั้นมักไม่เปิดตัวโมเดลของตนเพื่อให้สาธารณชนใช้งาน
เครื่องมือ AI อื่นๆ ที่ Meta เปิดตัวเมื่อวันศุกร์ รวมถึงการอัปเดตโมเดล Segment Anything สำหรับการระบุภาพ เครื่องมือที่เพิ่มความเร็วในการสร้างการตอบสนองของ LLM และชุดข้อมูลที่สามารถใช้เพื่อช่วยในการค้นพบวัสดุอนินทรีย์ใหม่ๆ