Meta’s CM3leon model and a reported commercial version of LLaMA could upend the generative AI industry.

Meta กำลังเพิ่มความพยายามด้านปัญญาประดิษฐ์อย่างอุกอาจเพื่อไล่ตามคู่แข่งอย่าง Google, Microsoft และ OpenAI ยักษ์ใหญ่ด้านโซเชียลมีเดียได้เปิดตัว text-to-image model ใหม่ที่เรียกว่า CM3leon ซึ่งอ้างว่ามีประสิทธิภาพที่ล้ำสมัยสำหรับการสร้างรูปภาพจาก text prompts แต่ยังไม่พร้อมเปิดให้ทดสอบงาน หรือใช้งานในเชิงพาณิชย์

Meta is aggressively ramping up its artificial intelligence efforts in a bid to catch up to rivals like Google, Microsoft, and OpenAI. The social media giant has introduced a new text-to-image model called CM3leon that it claims achieves state-of-the-art performance for generating images from text prompts. But it’s not yet available for testing or commercial use.

โมเดล CM3leon ของ Meta และ LLaMA เวอร์ชันเชิงพาณิชย์ที่ยกระดับอุตสาหกรรม generative AI

Meta กำลังเพิ่มความพยายามด้านปัญญาประดิษฐ์อย่างอุกอาจเพื่อไล่ตามคู่แข่งอย่าง Google, Microsoft และ OpenAI ยักษ์ใหญ่ด้านโซเชียลมีเดียได้เปิดตัว text-to-image model ใหม่ที่เรียกว่า CM3leon ซึ่งอ้างว่ามีประสิทธิภาพที่ล้ำสมัยสำหรับการสร้างรูปภาพจาก text prompts แต่ยังไม่พร้อมเปิดให้ทดสอบงาน หรือใช้งานในเชิงพาณิชย์

CM3leon ถือเป็นความก้าวหน้าครั้งสำคัญสำหรับความสามารถด้าน AI ของ Meta โมเดลนี้ไม่เพียงแต่สร้างภาพที่มีความคมชัดสูงจากคำอธิบายข้อความเท่านั้น แต่ยังเขียนคำอธิบายภาพที่สอดคล้องกันสำหรับภาพที่มีอยู่ได้อีกด้วย นี่เป็นการวางรากฐานสำหรับโมเดลการทำความเข้าใจภาพขั้นสูงในอนาคต

Meta ใช้ประโยชน์จากทีมงานวิทยาศาสตร์ข้อมูล และโครงสร้างพื้นฐานด้านคอมพิวเตอร์ เพื่อพัฒนาโมเดลที่ล้ำสมัยอย่าง CM3leon ในขณะที่ diffusion-based AI เช่น MidJourney ได้รับความสนใจอย่างมาก Meta กำลังเดิมพันกับ autoregressive transformer architectures (เทคโนโลยีเดียวกับที่ ChatGPT ใช้) บริษัทอ้างว่า CM3leon ต้องการการประมวลผลการฝึกอบรมน้อยกว่าวิธีอื่นที่เทียบเคียงได้ 5 เท่า

ในการเปรียบเทียบแบบตัวต่อตัว CM3leon ดูเหมือนจะจัดการกับวัตถุที่ซับซ้อน และข้อจำกัดใน prompt ได้ดีกว่าโมเดลอย่าง DALL-E 2 ของ OpenAI และแม้แต่ Midjourney ภาพที่แชร์โดย Meta แสดงให้เห็นว่าโปรแกรม text-to-image generator ใหม่สามารถแสดงกายวิภาคของมนุษย์ได้อย่างแม่นยำ (ไม่ต้องเจอปัญหามือสปาเก็ตตี้อีกต่อไป) และยังสามารถสร้างอธิบายภาพที่ถูกต้อง (ไม่สุ่มคำอธิบายรูปภาพโดย AI แบบหลอนๆ แล้ว)

CM3leon ยังมีรูปภาพขั้นสูง ที่ช่วยให้ผู้ใช้สร้างภาพได้ตรงกับจินตนาการของพวกเขาได้แม่นยำมากขึ้น: Text to image, image to image, structure-guided image editing, object to image, segmentation to image และ super-resolution upscaling เป็นคุณสมบัติบางอย่าง ที่ไม่สามารถใช้งานได้ ใน generative AI ใดๆ ที่ไม่ใช่ Stable Diffusion โดยใช้ Controlnet

ข่าวลือของ LLM ใหม่

มีรายงานว่า Meta กำลังวางแผนที่จะปล่อยโมเดลภาษาธรรมชาติ LLaMA เวอร์ชันเชิงพาณิชย์ ให้กับนักพัฒนาภายนอก ตามแหล่งข่าวที่อ้างถึงโดย Financial Times หากเป็นจริง สิ่งนี้จะช่วยให้สตาร์ทอัพและองค์กรต่างๆ สามารถสร้างแอปพลิเคชันแบบกำหนดเองที่ขับเคลื่อนโดย AI ของ Meta ได้ ทำให้โซเชียลมีเดียมีการแข่งขันโดยตรงกับ ChatGPT (OpenAI-Microsoft), Bard (Google) และ Claude v2 (Anthropic-Google)

ดูเหมือนว่าการโฟกัสของ Meta จะมุ่งไปที่ AI อย่างมากในทุกแอป แม้ว่าจะมีการอ้างว่าเน้นหนักไปที่โปรเจกต์ metaverse ก็ตาม เมื่อต้นปีที่ผ่านมา บริษัทได้จัดตั้งหน่วย generative AI โดยเฉพาะซึ่งนำโดย Chris Cox ประธานเจ้าหน้าที่ฝ่ายผลิตภัณฑ์ Meta ยังทำงานกับเครื่องมือ AI ที่สร้างโฆษณาที่ดีขึ้นเพื่อกำหนดเป้าหมายผู้ใช้

ด้วยโมเดลหลักแบบโอเพ่นซอร์ส เช่น leaked LLaMA LLM (LLM โอเพ่นซอร์สที่ใหญ่ที่สุด ทันสมัยที่สุดในโลก) Meta มีเป้าหมายที่จะกระตุ้นนวัตกรรมจากนักพัฒนาทั่วโลกเพื่อปรับปรุงเทคโนโลยี สิ่งนี้ตรงกันข้ามกับแนวทางปิดของคู่แข่งอย่าง OpenAI อย่างไรก็ตาม การสร้างรายได้จากโมเดลของ Meta ยังคงมีความเป็นไปได้ในอนาคต

ความวุ่นวายของกิจกรรม AI เกิดขึ้นเมื่อ Meta ต่อสู้กับมูลค่าหุ้นที่ลดลงและการโต้เถียงเกี่ยวกับความเป็นส่วนตัวและข้อมูลที่ผิดซึ่งเกิดจากกิจกรรมบน Facebook ซึ่งยังคงเป็นแพลตฟอร์มที่ใหญ่ที่สุดของบริษัท Mark Zuckerberg CEO ของ Meta เชื่อว่าการลงทุนจำนวนมากใน generative AI นี้สอดคล้องกับวิสัยทัศน์ของบริษัทสำหรับ Metaverse และสามารถเปิดแหล่งรายได้ใหม่

Meta ยังเพิ่งเปิดตัว Threads ซึ่งเป็นตัวโคลนของ Twitter ที่เห็นการเติบโตของผู้ใช้อย่างรวดเร็ว ซึ่งแซงหน้า OpenAI ที่ทำได้หลังจากเปิดตัว ChatGPT นอกจากนี้ยังได้รับการพิสูจน์แล้วว่าเชี่ยวชาญในการนำองค์ประกอบสำคัญของเทคโนโลยีก่อนหน้า มาปรับปรุง และสร้างผลิตภัณฑ์ที่ประสบความสำเร็จซึ่งเกือบจะฆ่าคู่แข่งบนพื้นฐานที่พวกเขาสร้างขึ้น

ด้วยโมเดลใหม่อย่าง CM3leon ที่แสดงประสิทธิภาพที่น่าพึงพอใจ Meta ดูเหมือนจะมุ่งมั่นที่จะไล่ตาม AI อย่างจริงจังเพื่อเปลี่ยนแปลงอนาคตของมัน หลังจากที่ปล่อยให้นักลงทุนไม่ประทับใจกับความพยายามของ metaverse การแข่งขันเพื่อเป็นผู้นำด้าน generative AI

view original *