New Chinese AI model ‘better than industry leader’ in key metrics.

Spark v3.5 โมเดล AI ใหม่ของจีน ที่เพิ่งประกาศว่า สามารถเอาชนะ GPT-4 ของ OpenAI ในด้าน language workloads และสามารถสังเคราะห์คำพูดของมนุษย์ที่ถ่ายทอดอารมณ์ น้ำเสียง และรูปแบบคำพูดที่แตกต่างกัน

The newly announced Spark v3.5 can beat OpenAI’s GPT-4 in language workloads, among other areas, and can synthesize human speech that conveys different emotions, tones and speech patterns, its creators claim.

โมเดล AI ใหม่ของจีน ‘ดีกว่า GPT-4 ผู้นำในอุตสาหกรรม’ ในด้านต่างๆ ที่สำคัญ

นักวิทยาศาสตร์ชาวจีนอ้างว่าพวกเขาได้สร้างระบบปัญญาประดิษฐ์ (AI) ที่สามารถเอาชนะแบบจำลองภาษาขนาดใหญ่ (LLM) ที่ใช้กันอย่างแพร่หลายมากที่สุดในโลก

Spark v3.5 โมเดล AI ของ iFlytek แซงหน้า GPT-4 Turbo ของ OpenAI ในด้านความสามารถทางภาษา คณิตศาสตร์ และการเขียนโค้ด และมีความใกล้เคียงกับระบบ AI ของอเมริกาในด้านอื่นๆ อีกหลายด้าน ตามรายงานของ Shine สื่อในเครือของรัฐบาลจีน

Liu Qingfeng ประธาน iFlytek กล่าวในการประชุมของบริษัทเมื่อวันที่ 29 มกราคมในการประชุมของบริษัทว่า Spark v3.5 ยังดีกว่า GPT-4 Turbo เล็กน้อยในงานหลายรูปแบบ ซึ่งหมายความว่ามีความเชี่ยวชาญมากขึ้นในการทำความเข้าใจอินพุตประเภทหนึ่งและจัดเตรียมเอาต์พุตรูปแบบอื่นเป็นคำตอบ เช่น การใส่ text prompt และการสร้างรูปภาพ

GPT-4 Turbo เป็นเวอร์ชันอัปเกรดของ GPT-4 ซึ่งใช้ในการขับเคลื่อน ChatGPT และได้รับการยอมรับอย่างกว้างขวางว่าเป็นหนึ่งในเครื่องมือ AI ที่ทรงพลังที่สุดนับตั้งแต่เปิดตัวในเดือนพฤศจิกายน 2023

ปัจจุบันไม่ได้คนกลางที่น่าเชื่อถือ พัฒนาเบนช์มาร์กที่เป็นเกณฑ์มาตรฐานเพื่อเปรียบเทียบ LLM แต่ละโมเดล และไม่มีฐานข้อมูลในการเปรียบเทียบระบบ AI ของแต่ละบริษัทที่ได้รับการยอมรับโดยทั่วไป แต่บริษัทต่างๆ ใช้เกณฑ์มาตรฐานที่แตกต่างกันมากมาย เพื่อสร้างคะแนนประสิทธิภาพในด้านต่างๆ บริษัท AI มักใช้โมเดลเหล่านี้เพื่อเปรียบเทียบโมเดลของตนเองกับโมเดลชั้นนำของอุตสาหกรรม

ตัวอย่างเช่น Google เปิดเผยในเดือนธันวาคม 2023 ว่า Gemini LLM ใหม่ของบริษัทเอาชนะเวอร์ชันมาตรฐานของ GPT-4 และโมเดลชั้นนำอื่นๆ ในเกณฑ์มาตรฐานทางวิชาการ 30 รายการจาก 32 รายการที่ใช้ในการวิจัยและพัฒนา AI ซึ่งรวมถึงการสอบระดับมัธยมศึกษาตอนปลายและการทดสอบคุณธรรม

รายงานโดย China Global Television Network (CGTN) ของรัฐเปิดเผยว่า Spark v.3.5 สามารถสังเคราะห์คำพูดที่ถ่ายทอดอารมณ์ น้ำเสียง และรูปแบบคำพูดที่แตกต่างกันได้ การจดจำเสียงยังมีประสิทธิภาพเหนือกว่า Whisper ของ OpenAI ใน 37 ภาษา รวมถึงภาษาอังกฤษ จีน ฝรั่งเศส และรัสเซีย CGTN รายงาน

iFlytek ได้รวม Spark เข้ากับอุปกรณ์อัจฉริยะ smart devices, school blackboards และ tablets แล้วบริษัทยังได้เปิดตัวแอปมือถือแปลงเสียงเป็นข้อความโดยร่วมมือกับ China Mobile เมื่อวันที่ 29 มกราคม ซึ่งใช้ Spark v3.5 เพื่อถอดเสียงการโทร และเน้นข้อมูลสำคัญที่ถ่ายทอดในการสนทนา

เครื่องมือ AI ได้รับการฝึกฝนเป็นเวลา 90 วัน บนแพลตฟอร์มคอมพิวเตอร์ที่เรียกว่า “Feixing No. 1” เนื่องจากข้อจำกัดในการส่งออกที่เกี่ยวข้องกับ AI ไปยังบริษัทจีน ซึ่งกำหนดโดยรัฐบาลสหรัฐฯ บริษัท AI จึงไม่สามารถฝึกอบรมโมเดล โดยใช้หน่วยประมวลผลกราฟิก (GPU) ที่สร้างโดย Nvidia รวมถึง A100 ซึ่งใช้ในการฝึก ChatGPT เช่นเดียวกับการฝึกอบรมโมเดลด้วยชิป H100 และ H200

view original *