‘Out of this world’: OpenAI’s text-to-video tool Sora sets internet alight

สตาร์ทอัพที่ได้รับการสนับสนุนจาก Microsoft ทำให้โซเชียลมีเดียต้องตะลึงด้วยวิดีโอที่สมจริงเกินจริงที่สร้างขึ้นโดยใช้ text prompts

Microsoft-backed startup stuns social media with hyper-realistic videos created using text prompts.

Sora เครื่องมือแปลงข้อความเป็นวิดีโอของ OpenAI ยอดเยี่ยม เหนือจินตนาการ

OpenAI ผู้สร้าง ChatGPT ได้เปิดตัวปัญญาประดิษฐ์รูปแบบใหม่ที่สร้างวิดีโอที่สมจริงตาม text prompts ก่อให้ปฏิกิริยาตอบรับทางบวกจากผู้ใช้ทางออนไลน์อย่างมากมาย

text-to-video model โมเดลการแปลงข้อความเป็นวิดีโอชื่อ Sora มี “ความเข้าใจอย่างลึกซึ้งในภาษา” และสามารถสร้าง “ตัวละครที่น่าสนใจซึ่งแสดงอารมณ์ความรู้สึกที่มีชีวิตชีวา” OpenAI กล่าวในบล็อกโพสต์เมื่อวันพฤหัสบดี

“Sora สามารถสร้างฉากที่ซับซ้อนด้วยตัวละครหลายตัว การเคลื่อนไหวประเภทเฉพาะ และรายละเอียดที่แม่นยำของวัตถุและพื้นหลัง” สตาร์ทอัพที่ได้รับการสนับสนุนจาก Microsoft กล่าว

“โมเดลนี้ไม่เพียงแต่เข้าใจคำสั่ง prompt ที่ผู้ใช้ร้องขอในทันที แต่ยังเข้าใจถึงธรรมชาติของสิ่งเหล่านั้นมีอยู่ในโลกทางกายภาพด้วย”

Sam Altman ซีอีโอของ OpenAI เขียนบน X เชิญชวนให้ผู้ใช้แนะนำคำแนะนำสำหรับ Sora ก่อนที่จะโพสต์ผลลัพธ์ที่มีวิดีโอสมจริงของ โกลเด้นรีทรีฟเวอร์สองตัวที่กำลังพอดแคสต์อยู่บนภูเขา คุณย่ากำลังทำย็อกคิ และสัตว์ทะเลที่เข้าร่วมการแข่งขันจักรยานในมหาสมุทร



คุณภาพของวิดีโอที่สมจริงเกินจริงทำให้เกิดปฏิกิริยาตอบรับที่น่าตกตะลึงในโซเชียลมีเดีย โดยผู้ใช้เรียกผลลัพธ์ว่า “ยอดเยี่ยมเหนือจินตนาการ” และ “เป็นผู้เปลี่ยนเกม”

“ผ่านไปสองชั่วโมงแล้ว และสมองของฉันยังคงไม่สามารถประมวลผลวิดีโอ OpenAI Sora ที่สร้างขึ้นเหล่านี้ได้” Allen T ผู้ใช้ X กล่าว

การสาธิตความสามารถ text-to-video model ดังกล่าว ยังกระตุ้นให้เกิดความกังวลเกี่ยวกับความเสี่ยงที่อาจเกิดขึ้น โดยเฉพาะอย่างยิ่ง ในปีที่มีการจับตาดูการเลือกตั้งทั่วโลกอย่างใกล้ชิด รวมถึงการเลือกตั้งประธานาธิบดีสหรัฐฯ ในเดือนพฤศจิกายน

OpenAI กล่าวในบล็อกโพสต์ว่าจะดำเนินการตามขั้นตอนความปลอดภัยที่สำคัญหลายประการก่อนที่จะปล่อย Sora สู่การใช้งานสาธารณะ

“เรากำลังทำงานร่วมกับ red teamers ผู้เชี่ยวชาญในด้านต่างๆ เพื่อทดสอบโมเดล ตรวจสอบการใช้งาน เพื่อรับมือปัญหาที่อาจเกิดขึ้น เช่น ข้อมูลที่ไม่ถูกต้อง เนื้อหาแสดงความเกลียดชัง และอคติ ” บริษัทกล่าว

“เรายังสร้างเครื่องมือเพื่อช่วยตรวจจับเนื้อหาที่ทำให้เกิดความเข้าใจผิด เช่น detection classifier ที่สามารถบอกได้ว่าวิดีโอคอนเทนท์นั้น ถูกสร้างขึ้นโดย Sora”

OpenAI ยังรับทราบด้วยว่า Sora มีจุดอ่อน รวมถึงอุปสรรคที่ยากลำบาก ในเรื่องการสร้างความต่อเนื่องของวิดีโอคอนเทนท์ และความสามารถในการแยกแยะซ้ายจากขวา

“ตัวอย่างเช่น เมื่อสร้างวิดีโอคนกัดคุกกี้ แต่หลังจากนั้น ชิ้นคุกกี้กลับไม่มีรอยแหว่งจากรอยกัด” สตาร์ทอัพในซานฟรานซิสโกกล่าว

Meta และ Google ซึ่งเป็นคู่แข่งของ OpenAI ได้สาธิตเทคโนโลยี AI แปลงข้อความเป็นวิดีโอเฝด้วย text-to-video model เช่นกัน แต่โมเดลของพวกเขายังไม่ได้ให้ผลลัพธ์ที่สมจริงเท่ากับของ Sora

view original *