SenseTime SenseNova 5.5: China’s first real-time multimodal AI model

SenseTime ได้เปิดตัว SenseNova 5.5 ซึ่งเป็นเวอร์ชันปรับปรุงของ LLM ซึ่งรวมถึง SenseNova 5o ที่ได้รับการขนานนามว่าเป็น multimodal model แบบเรียลไทม์ตัวแรกของจีน

SenseTime has unveiled SenseNova 5.5, an enhanced version of its LLM that includes SenseNova 5o—touted as China’s first real-time multimodal model.

SenseTime SenseNova 5.5: multimodal AI model แบบเรียลไทม์ตัวแรกของจีน

SenseTime ได้เปิดตัว SenseNova 5.5 ซึ่งเป็นเวอร์ชันปรับปรุงของ LLM ซึ่งรวมถึง SenseNova 5o ที่ได้รับการขนานนามว่าเป็น multimodal model แบบเรียลไทม์ตัวแรกของจีน

SenseNova 5o แสดงถึงการก้าวกระโดดในการโต้ตอบของ AI โดยมอบความสามารถที่ทัดเทียมกับฟีเจอร์การโต้ตอบการสตรีมของ GPT-4o ความก้าวหน้านี้ช่วยให้ผู้ใช้มีส่วนร่วมกับโมเดลในลักษณะที่คล้ายกับการสนทนากับบุคคลจริง ทำให้เหมาะอย่างยิ่งสำหรับการสนทนาแบบเรียลไทม์และการจดจำเสียงพูด

จากข้อมูลของ SenseTime โมเดลล่าสุดมีประสิทธิภาพเหนือกว่าคู่แข่งในหลายเกณฑ์มาตรฐาน:

Dr. Xu Li ประธานคณะกรรมการและซีอีโอของ SenseTime กล่าวว่า “นี่เป็นปีที่สำคัญสำหรับโมเดลขนาดใหญ่ เนื่องจากโมเดลมีการพัฒนาจากรูปแบบเดียวไปสู่หลายรูปแบบ เพื่อให้สอดคล้องกับความต้องการของผู้ใช้ SenseTime ยังมุ่งเน้นไปที่การเพิ่มการโต้ตอบอีกด้วย

“ด้วยแอปพลิเคชันที่ขับเคลื่อนการพัฒนาโมเดลและขีดความสามารถ ควบคู่ไปกับความก้าวหน้าทางเทคโนโลยีในการโต้ตอบการสตรีมหลายรูปแบบ เราจะได้เห็นการเปลี่ยนแปลงอย่างที่ไม่เคยเกิดขึ้นมาก่อนในการโต้ตอบระหว่างมนุษย์กับ AI”

SenseNova 5.5 ที่อัปเกรดแล้วมีประสิทธิภาพโดยรวมดีขึ้น 30% เมื่อเทียบกับรุ่นก่อน SenseNova 5.0 ซึ่งเปิดตัวเพียงสองเดือนก่อนหน้านี้ การปรับปรุงที่โดดเด่น ได้แก่ การปรับปรุงการใช้เหตุผลทางคณิตศาสตร์ ความสามารถทางภาษาอังกฤษ และความสามารถในการปฏิบัติตามคำสั่ง

ในความเคลื่อนไหวเพื่อทำให้การเข้าถึงความสามารถ AI ขั้นสูงเป็นประชาธิปไตย SenseTime ได้เปิดตัวโมเดลขนาดใหญ่ฝั่ง Edge ที่คุ้มค่า การพัฒนานี้ช่วยลดต้นทุนต่ออุปกรณ์ให้เหลือเพียง 9.90 หยวน ($1.36) ต่อปี ซึ่งอาจเร่งให้เกิดการยอมรับอย่างกว้างขวางในอุปกรณ์ IoT ต่างๆ

บริษัทยังได้เปิดตัว “Project $0 Go” ซึ่งเป็นแพ็คเกจการเริ่มต้นใช้งานฟรีสำหรับผู้ใช้ระดับองค์กรที่ย้ายจากแพลตฟอร์ม OpenAI โครงการริเริ่มนี้ประกอบด้วยแพ็คเกจโทเค็น 50 ล้านและบริการให้คำปรึกษาการย้าย API ซึ่งมีเป้าหมายเพื่อลดอุปสรรคในการเข้าสู่ธุรกิจที่ต้องการใช้ประโยชน์จากความสามารถของ SenseNova

ความมุ่งมั่นของ SenseTime ที่มีต่อ AI ฝั่งขอบนั้นเห็นได้ชัดเจนในการเปิดตัว SenseChat Lite-5.5 ซึ่งมีคุณสมบัติลดเวลาในการอนุมานลง 40% เมื่อเทียบกับรุ่นก่อน โดยขณะนี้เหลือเพียง 0.19 วินาที ความเร็วในการอนุมานยังเพิ่มขึ้น 15% เป็น 90.2 คำต่อวินาที

SenseTime ได้เปิดตัว Vimi ซึ่งเป็น AI avatar video generator ที่ควบคุมได้ เพื่อขยายชุดแอปพลิเคชัน AI เครื่องมือนี้สามารถสร้างคลิปวิดีโอสั้น ๆ ที่ควบคุมการแสดงออกทางสีหน้าและการเคลื่อนไหวของร่างกายส่วนบนได้อย่างแม่นยำจากภาพถ่ายเพียงภาพเดียว เปิดโอกาสใหม่ในแอปพลิเคชันด้านความบันเทิงและการโต้ตอบ

บริษัทยังได้อัปเกรด SenseTime Raccoon Series ซึ่งเป็นชุดเครื่องมือเพิ่มประสิทธิภาพการทำงานของ AI ขณะนี้ Code Raccoon มีการปรับปรุงความเร็วในการตอบสนองเพิ่มขึ้น 5 เท่า และความแม่นยำในการเขียนโค้ดเพิ่มขึ้น 10% ในขณะที่ Office Raccoon ได้ขยายให้ครอบคลุมถึงหน้าเว็บสำหรับผู้ใช้ทั่วไปและเวอร์ชันมินิแอป WeChat

เทคโนโลยีโมเดลขนาดใหญ่ของ SenseTime กำลังสร้างกระแสให้กับอุตสาหกรรมต่างๆ ในภาคการเงิน กำลังปรับปรุงประสิทธิภาพในการปฏิบัติตามกฎระเบียบ การตลาด และการวิจัยการลงทุน ในด้านการเกษตร ช่วยลดการใช้วัสดุลง 20% ในขณะที่เพิ่มผลผลิตพืชผล 15% อุตสาหกรรมการท่องเที่ยวเชิงวัฒนธรรมได้รับการส่งเสริมอย่างมากในการวางแผนการเดินทางและประสิทธิภาพการจอง

ด้วยลูกค้าภาครัฐและองค์กรมากกว่า 3,000 รายที่ใช้ SenseNova ในภาคส่วนเทคโนโลยี การดูแลสุขภาพ การเงิน และการเขียนโปรแกรม SenseTime กำลังรักษาตำแหน่งของตนในฐานะผู้เล่น AI คนสำคัญ

view original *