MiniMax’s Hailuo AI text-to-video generator: How does it stack up?

MiniMax บริษัทจากจีนได้เปิดตัว Hailuo AI ซึ่งเป็น AI text-to-video generator โมเดลสร้างวิดีโอจากข้อความที่พัฒนาขึ้นเอง เข้าสู่วงการการสร้างวิดีโอด้วย AI ที่กำลังพัฒนาอย่างรวดเร็ว

China’s MiniMax has unveiled Hailuo AI, its proprietary text-to-video model, entering the fray in the fast-evolving world of AI video generation.

Hailuo AI text-to-video generator ของ MiniMax มีความสามารถล้ำแค่ไหน

MiniMax สตาร์ทอัพด้าน AI จากจีนที่กำลังมาแรง กำลังสร้างความฮือฮาด้วยการเปิดตัวโมเดล AI สร้างวิดีโอจากข้อความรุ่นล่าสุด ที่มีชื่อว่า Video-01 และชื่อทางการค้าว่า Hailuo AI บริษัทซึ่งได้รับการสนับสนุนจากยักษ์ใหญ่ด้านเทคโนโลยีอย่าง Alibaba และ Tencent ได้เปิดตัวโมเดลใหม่นี้ในช่วงต้นเดือนกันยายน โดยได้รับความสนใจจากความสามารถในการสร้างคลิปวิดีโอที่สมจริง

การเปิดตัว Hailuo AI เกิดขึ้นในช่วงเวลาสำคัญของอุตสาหกรรม  generative AI  ขณะที่การแข่งขันเพื่อครองตลาดวิดีโอที่สร้างด้วย AI กำลังดุเดือด ผู้เล่นรายใหญ่อย่าง Sora ของ OpenAI, Runway และ Veo ของ Google กำลังแข่งขันกันอยู่ในพื้นที่นี้ ในขณะที่ Kuaishou บริษัทมหาชนของจีนเพิ่งเปิดตัว Kling AI ซึ่งเป็นแพลตฟอร์ม  generative AI ที่มีฟีเจอร์สร้างวิดีโอจากข้อความเช่นกัน

Hailuo AI เทียบกับ Kling AI

เพื่อประเมินประสิทธิภาพของโมเดล มีการทดสอบเบื้องต้นโดยใช้คำสั่งหลายข้อที่เหมือนกับที่ใช้กับ Kling AI ของ Kuaishou ก่อนหน้านี้

แม้ว่าจะไม่มีความแตกต่างอย่างมีนัยสำคัญในคุณภาพการสร้างภาพสำหรับคำสั่งเกี่ยวกับลูกแมว ไม่ว่าจะใช้ภาษาอังกฤษหรือภาษาจีน แต่ Kling AI สามารถจัดการกับคำขอที่ไม่ธรรมดาได้แม่นยำกว่า ในการทดสอบ Kling AI ก่อนหน้านี้ มันแสดงภาพลูกแมวใช้อุปกรณ์รับประทานอาหารได้ใกล้เคียงกับวิธีที่มนุษย์จะกินมากกว่า ในทางตรงกันข้าม ผลลัพธ์ของ Hailuo AI แสดงแมวในลักษณะที่เป็นสัตว์มากกว่า โดยมีท่าทางคล้ายกับวิธีที่แมวจะกินอาหารตามธรรมชาติ

อย่างไรก็ตาม ในการเปรียบเทียบโดยตรงสำหรับคำสั่งให้สร้างวิดีโอ “ลูกสุนัขขับรถแบบสมจริง” Hailuo AI สามารถให้การตีความที่สมจริงมากกว่า ผลลัพธ์ของมันแสดงลูกสุนัขอยู่ที่พวงมาลัย ดูราบรื่นและน่าเชื่อถือ แต่ก็ยังขาดจินตนาการในการทำให้ลูกสุนัขคนขับมีลักษณะเหมือนมนุษย์

นอกจากนี้ รายงานจากสื่อต่างๆ ชี้ว่าจุดแข็งสำคัญของ Hailuo AI อยู่ที่ความสามารถในการสร้างการเคลื่อนไหวที่เหมือนมนุษย์ได้อย่างสมจริงมาก เพื่อยืนยันข้อสังเกตเหล่านี้ จึงมีการออกคำสั่งสองข้อให้ Hailuo AI จัดการ: “นักบินอวกาศซ่อมแซมสถานีอวกาศที่โคจรรอบโลก” และ “อัศวินยุคกลางในการต่อสู้” โดยมีจุดประสงค์เพื่อทดสอบความสามารถของโมเดลในการจัดการกับการเคลื่อนไหวที่ซับซ้อนในสถานการณ์เหล่านี้

เช่นเดียวกับคำสั่งลูกสุนัขขับรถ Hailuo AI ค่อนข้างตีความการเคลื่อนไหวของนักบินอวกาศแบบน่าเบื่อ  แม้ว่าผลลัพธ์จะน่าพอใจเมื่อพิจารณาถึงระยะเริ่มต้นของการสร้างวิดีโอด้วย AI จากข้อความ

อย่างไรก็ตาม เมื่อได้รับมอบหมายให้สร้างวิดีโอหลัง Hailuo AI ดูเหมือนจะมีปัญหากับความซับซ้อนที่รับรู้ได้ของฉาก อัศวินปรากฏขึ้นอย่างไม่คาดคิด ดูเหมือนจะออกมาจากด้านหลังของตัวละครอื่น และการเคลื่อนไหวของพวกเขาไม่สอดคล้องกันเพียงพอ

เพื่อทดสอบว่าความเฉพาะเจาะจงสามารถปรับปรุงผลลัพธ์ได้หรือไม่ จึงมีการทดสอบคำสั่งติดตามสำหรับ “อัศวินยุคกลางสองคนในการต่อสู้” ผลลัพธ์ดีขึ้น แต่ก็ยังไม่ดีพอ – การเคลื่อนไหวบางอย่างดูซ้ำซากเกินไป และจังหวะเร็วเกินไปที่จะดูสมจริง

Hailuo AI เวอร์ชันปัจจุบันสามารถสร้างคลิปวิดีโอความยาว 6 วินาที ที่ความละเอียด 1280×720 ที่ 25 เฟรมต่อวินาที โมเดลนี้ถูกจำกัดด้วยระยะเวลาคลิปที่สั้น แม้ว่า MiniMax ได้สัญญาว่าจะแก้ไขปัญหานี้ในการอัปเดตในอนาคต Hailuo AI รุ่นใหม่กำลังอยู่ในขั้นตอนการพัฒนาแล้ว คาดว่าจะมีระยะเวลาคลิปที่ยาวขึ้นและแนะนำฟีเจอร์ใหม่ๆ เช่น การแปลงภาพเป็นวิดีโอ ซึ่งเป็นสิ่งที่ Kling AI มีอยู่แล้ว

MiniMax ก่อตั้งในปี 2564 โดย Yan Junjie อดีตรองประธานและหัวหน้าฝ่ายเทคโนโลยี AI ทั่วไปของ SenseTime บริษัทได้ก้าวเข้าสู่อุตสาหกรรม AI อย่างรวดเร็ว ในเดือนมีนาคมปีนี้ มีรายงานว่าบริษัทได้ระดมทุนอย่างน้อย 600 ล้านดอลลาร์สหรัฐจากนักลงทุนหลายราย รวมถึง HongShan โดยคาดว่า Alibaba จะเป็นผู้นำในรอบนี้ ซึ่งเพิ่มเติมจากเงินทุน 250 ล้านดอลลาร์สหรัฐที่ MiniMax ระดมทุนได้ในช่วงกลางปีที่แล้ว โดยมี Tencent และนักลงทุนรายอื่นๆ สนับสนุน การระดมทุนรอบล่าสุดที่นำโดย Alibaba นี้ มีรายงานว่าทำให้ MiniMax มีมูลค่ามากกว่า 2.5 พันล้านดอลลาร์สหรัฐ

MiniMax ยังเป็นหนึ่งในบริษัทแรกๆ ที่ได้รับอนุมัติจากปักกิ่งให้นำเสนอโมเดลภาษาขนาดใหญ่ (LLMs) สำหรับการใช้งานสาธารณะในเดือนสิงหาคม 2566 ซึ่งทำให้บริษัทอยู่ในกลุ่มผู้นำด้าน AI ของจีน ในขณะที่ประเทศเร่งพัฒนาความสามารถด้าน AI

นอกเหนือจาก Hailuo AI แล้ว MiniMax ยังนำเสนอโซลูชัน AI หลากหลาย รวมถึงการสร้างเสียงและภาษา แอป Talkie AI ของบริษัทได้รับการดาวน์โหลดหลายล้านครั้งและถูกขนานนามว่าเป็นหนึ่งใน “แอปบันเทิงที่ฮอตที่สุด” ในสหรัฐอเมริกาโดย WSJ

ด้วยการสนับสนุนทางการเงินที่แข็งแกร่งและพอร์ตโฟลิโอของเครื่องมือ AI ที่เติบโตขึ้น ความก้าวหน้าของ MiniMax จะเพิ่มแรงกดดันให้กับบริษัทอื่นๆ ในการแข่งขันด้าน AI เมื่อมีการปรับปรุง Hailuo AI เพิ่มเติม ยังคงต้องรอดูว่า MiniMax จะสามารถก้าวไปได้ไกลแค่ไหน

view original *