Meta raises the bar with open source Llama 3 LLM

Meta ได้เปิดตัว Llama 3 ซึ่งเป็นโอเพ่นซอร์สโมเดลภาษาขนาดใหญ่ (LLM) รุ่นต่อไปที่ล้ำสมัย บริษัทยักษ์ใหญ่ด้านเทคโนโลยีอ้างว่า Llama 3 ได้สร้างเกณฑ์มาตรฐานประสิทธิภาพใหม่ ซึ่งเหนือกว่ารุ่นชั้นนำในอุตสาหกรรมก่อนหน้านี้ เช่น GPT-3.5 ในสถานการณ์จริง

Meta has introduced Llama 3, the next generation of its state-of-the-art open source large language model (LLM). The tech giant claims Llama 3 establishes new performance benchmarks, surpassing previous industry-leading models like GPT-3.5 in real-world scenarios.

Meta ยกระดับมาตรฐานด้วยโอเพ่นซอร์ส Llama 3 LLM

Meta ได้เปิดตัว Llama 3 ซึ่งเป็นโอเพ่นซอร์สโมเดลภาษาขนาดใหญ่ (LLM) รุ่นต่อไปที่ล้ำสมัย บริษัทยักษ์ใหญ่ด้านเทคโนโลยีอ้างว่า Llama 3 ได้สร้างเกณฑ์มาตรฐานประสิทธิภาพใหม่ ซึ่งเหนือกว่ารุ่นชั้นนำในอุตสาหกรรมก่อนหน้านี้ เช่น GPT-3.5 ในสถานการณ์จริง

“ด้วย Llama 3 เรามุ่งมั่นที่จะสร้างโมเดลโอเพ่นซอร์ส ที่ดีที่สุดซึ่งทัดเทียมกับโมเดลที่มีกรรมสิทธิ์ที่ดีที่สุดที่มีอยู่ในปัจจุบัน” Meta กล่าวในโพสต์บล็อกที่ประกาศการเปิดตัว

รุ่น Llama 3 เริ่มแรกที่ถูกเปิดคือรุ่น 8 พันล้านพารามิเตอร์ และ 70 พันล้านพารามิเตอร์ Meta กล่าวว่าทีมงานยังคงฝึกอบรมโมเดลที่มีพารามิเตอร์ขนาดใหญ่กว่า 400 พันล้าน ขึ้นไป ซึ่งจะเปิดตัวในอีกไม่กี่เดือนข้างหน้า ควบคู่ไปกับงานวิจัยที่ให้รายละเอียดเกี่ยวกับงานดังกล่าว

Llama 3 ใช้เวลากว่าสองปีในการสร้างทรัพยากรที่สำคัญเพื่อรวบรวมข้อมูลการฝึกอบรมคุณภาพสูง ขยายขนาดการฝึกอบรมแบบกระจาย การเพิ่มประสิทธิภาพสถาปัตยกรรมโมเดล และวิธีการที่เป็นนวัตกรรมใหม่ในการปรับแต่งการสอนอย่างละเอียด

โมเดลที่ปรับแต่งคำสั่งพารามิเตอร์ 7 หมื่นล้านรายการของ Meta มีประสิทธิภาพเหนือกว่า GPT-3.5, Claude และ LLM อื่นๆ ในขนาดที่เทียบเคียงได้ในการประเมินโดยมนุษย์ในสถานการณ์การใช้งานหลัก 12 สถานการณ์ เช่น การเขียนโค้ด การใช้เหตุผล และการเขียนเชิงสร้างสรรค์ โมเดลที่ฝึกล่วงหน้าด้วยพารามิเตอร์ 8 พันล้านของบริษัทยังกำหนดเกณฑ์มาตรฐานใหม่ในงานประเมิน LLM ยอดนิยม:

“เราเชื่อว่า นี่เป็นโมเดลโอเพ่นซอร์สที่ดีที่สุดในชั้นเรียนและยุคสมัย” Meta กล่าว

ยักษ์ใหญ่ด้านเทคโนโลยีกำลังเปิดตัวโมเดลดังกล่าวผ่านแนวทาง “open by default” เพื่อเพิ่มระบบนิเวศแบบเปิด ในการพัฒนา AI Llama 3 จะให้ผู้ใช้งานเข้าถึงผ่านผู้ให้บริการคลาวด์รายใหญ่ โฮสต์โมเดล ผู้ผลิตฮาร์ดแวร์ และแพลตฟอร์ม AI

Victor Botev ซีทีโอและผู้ร่วมก่อตั้ง Iris.ai กล่าวว่า “ด้วยการเปลี่ยนแปลงทั่วโลกไปสู่การควบคุมด้าน AI การเปิดตัวโมเดล Llama 3 ของ Meta จึงมีความโดดเด่น ด้วยการเปิดรับความโปร่งใสผ่านโอเพ่นซอร์ส Meta สอดคล้องกับการเน้นที่เพิ่มมากขึ้นในแนวทางปฏิบัติของ AI ที่มีความรับผิดชอบและการพัฒนาทางจริยธรรม

”ยิ่งไปกว่านั้น สิ่งนี้ยังให้โอกาสสำหรับการศึกษาของชุมชนในวงกว้างขึ้น เนื่องจากโมเดลแบบเปิดช่วยให้เกิดข้อมูลเชิงลึกในการพัฒนาและความสามารถในการกลั่นกรองแนวทางต่างๆ ด้วยความโปร่งใสนี้จะส่งกลับไปสู่การร่างและการบังคับใช้กฎระเบียบ”

รุ่นล่าสุดของ Meta ที่มาพร้อมกับชุดเครื่องมือความปลอดภัย AI ที่ได้รับการปรับปรุง รวมถึง Llama Guard เพื่อจำแนกความเสี่ยง ที่พัฒนาขึ้น และ CyberSec Eval สำหรับการประเมินการใช้งานในทางที่ผิดที่อาจเกิดขึ้น องค์ประกอบใหม่ที่เรียกว่า Code Shield ได้รับการแนะนำเพื่อกรอง insecure code suggestions ณ inference time

“อย่างไรก็ตาม สิ่งสำคัญคือต้องเข้าใจว่า โมเดลที่เป็นโอเพ่นซอร์สไม่ได้เทียบเท่ากับ AI ที่มีจริยธรรมโดยอัตโนมัติ” Botev กล่าวต่อ “การจัดการกับความท้าทายของ AI ต้องใช้แนวทางที่ครอบคลุมในการแก้ไขปัญหาต่างๆ เช่น ความเป็นส่วนตัวของข้อมูล ความลำเอียงของอัลกอริทึม และผลกระทบทางสังคม ซึ่งทั้งหมดนี้มุ่งเน้นที่สำคัญของกฎระเบียบ AI ที่เกิดขึ้นทั่วโลก

”ในขณะที่โครงการริเริ่มแบบเปิดเช่น Llama 3 ส่งเสริมการตรวจสอบและการทำงานร่วมกัน ผลกระทบที่แท้จริงจะขึ้นอยู่กับแนวทางแบบองค์รวมในการปฏิบัติตามกฎระเบียบการกำกับดูแล AI และการฝังหลักจริยธรรมในวงจรชีวิตของระบบ AI ความพยายามอย่างต่อเนื่องของ Meta กับโมเดล Llama ถือเป็นก้าวไปในทิศทางที่ถูกต้อง แต่ AI ที่มีจริยธรรมต้องการความมุ่งมั่นที่ยั่งยืนจากผู้มีส่วนได้ส่วนเสียทั้งหมด”

Meta กล่าวว่าได้นำ “แนวทางระดับระบบ” มาใช้เพื่อการพัฒนา AI ที่รับผิดชอบและการใช้งานด้วย Llama 3 ในขณะที่โมเดลดังกล่าวได้รับการทดสอบความปลอดภัยอย่างกว้างขวาง บริษัทเน้นย้ำว่านักพัฒนาควรใช้การกรองอินพุต/เอาท์พุตของตนเองให้สอดคล้องกับข้อกำหนดของแอปพลิเคชันของตน

ผลิตภัณฑ์สำหรับผู้ใช้ของบริษัทที่รวม Llama 3 คือ Meta AI ซึ่ง Meta อ้างว่าปัจจุบันเป็นผู้ช่วย AI ชั้นนำของโลกด้วยโมเดลใหม่ ผู้ใช้สามารถเข้าถึง Meta AI ผ่านทาง Facebook, Instagram, WhatsApp, Messenger และเว็บเพื่อเพิ่มประสิทธิภาพ การเรียนรู้ ความคิดสร้างสรรค์ และคำถามทั่วไป

Meta AI เวอร์ชัน Multimodal ที่ผสานความสามารถ Meta AI integrating vision capabilities กำลังอยู่ในระหว่างดำเนินการ โดยจะมีการนำเสนอตัวอย่างการประยุกต์ใช้งานสำหรับแว่นตาอัจฉริยะ Ray-Ban ของ Meta

แม้ว่า Llama 3 จะประสบความสำเร็จอย่างมาก แต่บางคนในสาขา AI ก็ได้แสดงความกังขาต่อแรงจูงใจของ Meta ว่าเป็นแนวทางที่เปิดกว้าง “เพื่อประโยชน์ของสังคม”

อย่างไรก็ตาม เพียงหนึ่งวันหลังจากที่ Mistral AI ได้สร้างเกณฑ์มาตรฐานใหม่สำหรับโมเดลโอเพ่นซอร์สที่มี Mixtral 8x22B การเปิดตัว Meta ก็ยกระดับมาตรฐานสำหรับ open source LLM อีกครั้ง

view original *