Nvidia-backed AI startup Synthesia now lets you make multilingual video presentations using just your phone or webcam

เมื่อวันจันทร์ บริษัท Generative artificial intelligence Synthesia ได้เปิดตัวฟีเจอร์ AI ใหม่มากมาย รวมถึงความสามารถในการสร้าง AI-generated avatars โดยใช้เว็บแคมหรือโทรศัพท์ บริษัทสตาร์ทอัพที่ได้รับการสนับสนุนจาก Nvidia กล่าวว่าฟีเจอร์ใหม่นี้ จะเป็นชุดผลิตวิดีโอสำหรับบริษัทขนาดใหญ่ การอัปเดตผลิตภัณฑ์อื่น ๆ ที่ Synthesia เปิดตัวเมื่อวันจันทร์ ได้แก่ AI-generated avatars เต็มตัวพร้อมมือและแขน และเครื่องมือบันทึกหน้าจอที่แสดงAI-generated avatars AI ที่แนะนำผู้ใช้

Generative artificial intelligence firm Synthesia on Monday showed off a slew of new AI features, including the ability to produce AI avatars using webcams or a phone. The Nvidia-backed startup said the new features will make it more of an all-encompassing video production suite for large firms, rather than just a platform that offers AI-generated avatars. Other product updates Synthesia unveiled Monday included “full body” avatars with hands and arms and a screen recording tool that shows an AI avatar guiding users through what they’re watching.

Synthesia บริษัทสตาร์ทอัพ AI ที่สนับสนุนโดย Nvidia ช่วยให้คุณสร้างวิดีโอหลายภาษาได้โดยใช้เพียงโทรศัพท์หรือเว็บแคมของคุณ

เมื่อวันจันทร์ Synthesia ซึ่งเป็นบริษัทสตาร์ทอัพด้านปัญญาประดิษฐ์ของอังกฤษ ได้เปิดตัวการอัปเดตผลิตภัณฑ์ใหม่ๆ มากมาย รวมถึงความสามารถในการสร้าง AI-generated avatars สไตล์ Apple ของคุณเองด้วย โดยใช้เพียงเว็บแคมของแล็ปท็อปหรือโทรศัพท์ของคุณ

บริษัทอายุเจ็ดปี ซึ่งได้รับการสนับสนุนโดย Nvidia กล่าวว่าการอัปเดตผลิตภัณฑ์ใหม่จะทำให้เป็นชุดผลิตวิดีโอสำหรับบริษัทขนาดใหญ่ที่ครอบคลุมทุกอย่าง แทนที่จะเป็นเพียงแพลตฟอร์มที่ให้ผู้ใช้สามารถสร้าง AI-generated avatars

การอัปเดตใหม่ที่ Synthesia กำลังเปิดตัวคือความสามารถในการสร้างAI-generated avatars AI โดยใช้เว็บแคมหรือโทรศัพท์ AI-generated avatars “เต็มตัว” ด้วยมือและแขน และเครื่องมือบันทึกหน้าจอที่แสดงAI-generated avatars ที่จะนำทางคุณตลอดสิ่งที่คุณกำลังรับชม

Synthesia คืออะไร?

Synthesia ซึ่งบอกว่าเกือบครึ่งหนึ่งของ Fortfune 500 ใช้มัน ใช้ AI-generated avatars เพื่อวัตถุประสงค์ทุกประเภท

สิ่งเหล่านี้มีตั้งแต่การสร้างวิดีโอการฝึกอบรมที่ปรับแต่งโดยเฉพาะเพื่อเป็นแนวทางให้กับพนักงานเกี่ยวกับกระบวนการบางอย่าง หรือการสร้างสื่อส่งเสริมการขายที่สามารถแสดงในรูปแบบของวิดีโอ แทนที่จะเป็นอีเมลหรือการสื่อสารด้วยข้อความอื่นๆ

แต่นั่นไม่ได้เป็นเช่นนั้นเสมอไป ตามที่ผู้ร่วมก่อตั้งและซีอีโอ Victor Riparbelli กล่าว ในช่วงสามปีแรกของเรื่องราวของบริษัท Synthesia เริ่มต้นด้วยการพยายามขายเทคโนโลยีให้กับเอเจนซี่ในฮอลลีวูด และบริษัทผลิตวิดีโอที่มีงบประมาณสูง บริษัทใช้ computer vision เป็นเครื่องมือพากย์เสียงด้วย AI ซึ่งทำให้การเคลื่อนไหวของปากเหมือนจริงมากขึ้นในภาษาต่างๆ

“สิ่งที่เราพบคือเกณฑ์คุณภาพในการทำอะไรก็ตามกับคนเหล่านี้นั้นใหญ่มาก ไม่ว่าเราทำอะไร เราจะเป็นส่วนเล็กๆ ของกระบวนการที่ใหญ่กว่ามาก” Riparbelli กล่าวกับ CNBC ในการให้สัมภาษณ์ที่บริษัท สำนักงานลอนดอน

“สิ่งที่น่าสนใจกว่าคือแง่มุมของ democratization: มีผู้คนหลายล้านคนในโลกที่ต้องการสร้างวิดีโอ แต่พวกเขาทำไม่ได้ เพราะการสร้างวิดีโอในปัจจุบันทีค่าใช้จ่ายสูง พวกเขาไม่มีงบประมาณเพียงพอ”

ในคำกล่าวเปิดงานสไตล์ Apple ซีอีโอของ Synthesia เปิดเผยผลิตภัณฑ์ใหม่ของบริษัท โดยอ้างว่าเป็นชุดเครื่องมือที่เน้นประสิทธิภาพการทำงานมากขึ้นสำหรับการใช้งานในธุรกิจ แทนที่จะเป็นเพียงแพลตฟอร์มที่นำเสนอ AI-generated avatars

คำกล่าวเปิดงานสไตล์ Apple พร้อมเว็บแคม

หนึ่งในคุณสมบัติใหม่ที่ใหญ่ที่สุดที่บริษัทแสดงให้เห็นคือตัวเลือกในการสร้าง AI-generated avatars โดยการบันทึกวิดีโอน้อยกว่าห้านาที โดยใช้เว็บแคมหรือโทรศัพท์ของคุณ คุณยังสามารถโคลนเสียงของคุณ เพื่อให้ Avatars พูดได้หลายภาษา

โดยทั่วไป หากต้องการสร้าง AI-generated avatars โดยใช้แพลตฟอร์มของ Synthesia คุณจะต้องเข้าไปในสตูดิโอด้วยตนเอง นักแสดงที่เป็นมนุษย์เข้าไปในบูธบันทึกเสียง บันทึกเสียง และแสดงต่อหน้ากรีนสกรีนในฉากถ่ายทำจริง

นี่คือข้อมูลการฝึกอบรมทั้งหมดเพื่อให้อัลกอริธึม AI ของ Synthesia มีความแตกต่างทางใบหน้าและเสียงพูดที่จำเป็นในการสร้าง AI-generated avatars ที่เหมือนมนุษย์ที่พูดในลักษณะที่แสดงออก เมื่อต้นปีนี้ Synthesia ได้เปิดตัว AI-generated avatars ที่สื่อความหมายใหม่ ซึ่งสามารถถ่ายทอดอารมณ์ความรู้สึกของมนุษย์ รวมถึงความสุข ความเศร้า และความข้องขัดใจ

แต่ตอนนี้ Synthesia กำลังเปิดตัวซอฟต์แวร์ใหม่ซึ่งจะทำให้ผู้ใช้สามารถผลิตเวอร์ชันดิจิทัลของตนเองได้ง่ายขึ้นจากทุกที่ โดยใช้เพียงเว็บแคมและซอฟต์แวร์ของ Synthesia

บริษัทยังเปิดตัวความสามารถในการสร้างอวาตาร์เต็มตัวอีกด้วย สิ่งนี้แตกต่างจาก AI-generated avatars ปัจจุบันของ Synthesia ซึ่งจำกัดอยู่เพียงมุมมองแนวตั้งเท่านั้น ตอนนี้คุณสามารถเข้าไปในสตูดิโอที่มีกล้อง เซ็นเซอร์ และไฟมากมายอยู่รอบตัวคุณ เพื่อสร้าง AI-generated avatars ที่สามารถขยับมือได้

การสร้างมือเป็นสิ่งที่ AI มักทำได้ยาก บ่อยครั้งเป็นเพราะมือเป็นเพียงส่วนเล็กๆ ของร่างกายมนุษย์ และโดยทั่วไปแล้วไม่ได้เน้นไปที่เนื้อหาที่เป็นภาพ

Synthesia ยังเปิดตัวตัวเลือกในการเล่นวิดีโอของ AI-generated avatars ที่พูดในภาษาใดก็ได้ที่พวกเขาชอบ ไม่ว่าจะเป็นภาษาอังกฤษ ฝรั่งเศส เยอรมัน หรือจีน

ในอนาคต Synthesia กล่าวว่าจะสามารถปรับแต่ง AI-generated avatars สำหรับประเทศต่างๆ ได้ ตัวอย่างเช่น AI-generated avatars ของไนจีเรียที่เรียกใช้ผู้ใช้ผ่านบทช่วยสอนแทนที่จะเป็นชาวอเมริกัน

Synthesia ยังได้เปิดตัวผู้ช่วยวิดีโอ AI ใหม่ซึ่งสามารถสร้างบทสรุปของบทความและเอกสารทั้งหมดได้ เช่น ผู้เชี่ยวชาญด้านทรัพยากรบุคคลที่ทำวิดีโอสั้นๆ อธิบายสิทธิประโยชน์ของบริษัท เป็นต้น

ฟีเจอร์สำคัญอีกประการหนึ่งที่บริษัทกำลังเปิดตัวคือเครื่องมือบันทึกหน้าจอใหม่ ซึ่งแสดง AI-generated avatars ที่จะแนะนำคุณตลอดสิ่งที่คุณกำลังรับชม

Not chasing a ‘PR moment’

ในการสัมภาษณ์ของ CNBC กับเขา Riparbelli กล่าวถึงสิ่งที่ Synthesia พยายามทำในการยกเครื่องผลิตภัณฑ์ที่มุ่งเน้นองค์กร ซึ่งจะทำให้คล้ายกับยักษ์ใหญ่อย่าง Microsoft, Salesforce และ Zoom

“โลกถูกผลักดันด้วยสิ่งเหล่านี้ในช่วง 12 ถึง 18 ถึง 24 เดือน ที่ผ่านมา ซึ่งยอดเยี่ยมมาก” Riparbelli กล่าวกับ CNBC

“แต่ตอนนี้เราได้ทดลองมามากมาย และเราได้พบกรณีการใช้งานที่เหมาะสมสำหรับเทคโนโลยีเหล่านี้ซึ่งมีมูลค่าทางธุรกิจที่ยั่งยืน พวกเขาไม่เหมือนเพียงช่วงเวลาประชาสัมพันธ์ระยะสั้น”

“คุณต้องบรรลุเป้าหมายทางธุรกิจในการลดตั๋วสนับสนุนลูกค้าด้วยการแสดงวิดีโอแทนข้อความ หรือขายโดยการสร้างวิดีโอแทนที่จะส่งอีเมล” เขากล่าวเสริม

“ตอนนี้ผู้คนกำลังสร้างขั้นตอนการทำงานเกี่ยวกับเรื่องนั้น พวกเขาต้องการวิธีที่ดีกว่าในการบรรลุเป้าหมายทางธุรกิจ ไม่ใช่แค่อินเทอร์เฟซกับโมเดล AI นั่นคือสิ่งที่เรากำลังจะไปในฐานะบริษัท”

เมื่อปีที่แล้ว Synthesia ระดมทุนได้ 90 ล้านดอลลาร์ จากนักลงทุน รวมถึงบริษัทผู้ผลิตชิป Nvidia ในสหรัฐฯ และบริษัทร่วมลงทุน Accel ในรอบการระดมทุนที่มีมูลค่า 1 พันล้านดอลลาร์ และทำให้บริษัทมีสถานะ “unicorn”

คู่แข่งของบริษัท ได้แก่ AI video tools Veed, Colossyan, Elai และ HeyGen และแอพโซเชียลมีเดียของจีน TikTok ก็เพิ่งเปิดตัว Symphony Assistant ซึ่งเป็นผลิตภัณฑ์ที่ช่วยให้ผู้สร้างสามารถสร้าง AI-generated avatars ของตัวเองได้

บริษัทสร้างรายได้ผ่านแผนการกำหนดค่าสมัครสมาชิกจำนวนหนึ่ง ตั้งแต่ $22 สำหรับแผน “starter” และ $67 สำหรับแผน “creator” ไปจนถึงแผน “enterprise” แบบกำหนดเอง ซึ่งการกำหนดราคาจะขึ้นอยู่กับการเจรจากับทีมขายของ Synthesia

view original *