Valued at $1B, Kai-Fu Lee’s LLM startup unveils open source model

Kai-Fu Lee นักลงทุนแบบร่วมทุน (Venture Capitalist) และนักวิทยาศาสตร์คอมพิวเตอร์ต้องการสร้าง generative AI ของจีน ที่เทียบเท่ากับ OpenAI

The venture capitalist and computer scientist wants to create an OpenAI equivalent for China

สตาร์ทอัพ LLM ของ Kai-Fu Lee มีมูลค่า 1 พันล้านดอลลาร์ เผยโมเดลโอเพ่นซอร์ส

Kai-Fu Lee นักวิทยาศาสตร์คอมพิวเตอร์ ซึ่งเป็นที่รู้จักในโลกตะวันตกจากหนังสือขายดีของเขา “AI Superpowers” ​​และเป็นที่รู้จักในประเทศจีน จากการเดิมพันกับยูนิคอร์นด้านปัญญาประดิษฐ์ มีการลงทุนครั้งใหม่ — และความทะเยอทะยานอันยิ่งใหญ่

ในช่วงปลายเดือนมีนาคม Lee ได้เปิดตัวบริษัทชื่อ 01.AI โดยมีวิสัยทัศน์ในการพัฒนาโมเดลภาษาขนาดใหญ่ที่ผลิตเองสำหรับตลาดจีน การร่วมทุนครั้งนี้ทำให้เขาต้องแข่งขันกับผู้นำด้านเทคโนโลยีที่มีชื่อเสียงของจีน รวมถึง Wang Xiaochuan ผู้ก่อตั้ง Sogou ซึ่งได้รวบรวมความสามารถและการร่วมทุนอย่างรวดเร็วเพื่อสร้าง OpenAI ที่เทียบเท่ากับจีน

“ผมคิดว่าความจำเป็นเป็นบ่อเกิดของนวัตกรรม และเห็นได้ชัดว่ามีความจำเป็นอย่างมากในจีน” Lee วัย 61 ปีและซีอีโอของบริษัท 01.AI กล่าวกับ TechCrunch ในการให้สัมภาษณ์ โดยอธิบายถึงแรงจูงใจเบื้องหลังการเริ่มต้นบริษัท “จีนไม่เหมือนกับประเทศอื่นๆ ในโลกตรงที่ไม่สามารถเข้าถึง OpenAI และ Google ได้ เนื่องจากทั้งสองบริษัทไม่ได้จำหน่ายผลิตภัณฑ์ของตนในจีน ดังนั้นผมคิดว่าหลายๆ คนที่ทำ LLM กำลังพยายามมีส่วนร่วมในการสร้างโซลูชันสำหรับตลาด ที่ต้องการสิ่งนี้จริงๆ”

การเติบโตของ 01. AI สะท้อนให้เห็นการพัฒนาอย่างรวดเร็วในด้าน generative AI เจ็ดเดือนหลังจากการก่อตั้ง บริษัทสตาร์ทอัพได้เปิดตัว Yi-34B Large Language Model รุ่นแรก ซึ่งเป็นโอเพ่นซอร์ส การตัดสินใจแนะนำ LLM แบบโอเพ่นซอร์ส เป็นผลิตภัณฑ์เปิดตัวเป็นวิธีการ “ตอบแทน” ให้กับสังคม Lee กล่าว สำหรับผู้ที่รู้สึกว่า LLaMA เป็น “สวรรค์” สำหรับพวกเขา “เราได้มอบทางเลือกที่น่าสนใจ” เขากล่าวเสริม

ในระหว่างที่เขียนบทความนี้ Yi-34B ซึ่งเป็นโมเดลพื้นฐานแบบสองภาษา (อังกฤษและจีน) ที่ได้รับการฝึกอบรมด้วยพารามิเตอร์ 34 พันล้านพารามิเตอร์ และมีขนาดเล็กกว่าโมเดล LLM โอเพ่นซอร์สอื่นๆ อย่างมาก เช่น Falcon-180B และ Meta LlaMa2-70B โดยได้รับอันดับหนึ่ง ในบรรดา pre-trained LLM models ตามการจัดอันดับโดย Hugging Face

“เราบางคนยังคงเชื่อว่าโมเดลขนาดใหญ่กว่า เมื่อได้รับการฝึกอบรมอย่างดีด้วยข้อมูลคุณภาพสูงจำนวนมาก จะมีประสิทธิภาพเหนือกว่าโมเดลขนาดเล็กกว่า ซึ่งมีคุณภาพเทียบเท่าและเทคโนโลยีที่เท่ากัน แต่ผมคิดว่า [Yi-34B] มีประสิทธิภาพเหนือกว่าโมเดลที่ใหญ่กว่ามาก เป็นเรื่องปกติ ที่บางคนไม่คิดว่าจะเป็นเช่นนั้น” Lee กล่าว “เรารู้สึกค่อนข้างมั่นใจเมื่อเราเปิดตัวรุ่นที่มีมูลค่า 100 พันล้านถึง 400 พันล้านในปีครึ่งปีถัดไป โมเดลเหล่านี้จะดีกว่ารุ่นที่เราประกาศในวันนี้อย่างมาก”

ความสามารถของสตาร์ทอัพในการเริ่มต้นการฝึกอบรมโมเดลอย่างรวดเร็วนั้นไม่ต้องสงสัยเลยว่าเป็นผลมาจากการระดมทุนที่ราบรื่น ซึ่งมีความสำคัญอย่างยิ่งต่อการรักษาผู้มีความสามารถระดับสูงและโปรเซสเซอร์ AI ในขณะที่ปฏิเสธที่จะเปิดเผยว่า 01.AI ระดมทุนได้มากเพียงใด Lee กล่าวว่ามีมูลค่า 1 พันล้านดอลลาร์หลังจากได้รับเงินทุนจาก Sinovation Ventures, Alibaba Cloud และนักลงทุนรายอื่นที่ไม่เปิดเผย

01.AI ได้เติบโตขึ้นจนมีพนักงานมากกว่า 100 คน โดยมากกว่าครึ่งหนึ่งเป็นผู้เชี่ยวชาญด้าน LLM จากบริษัทเทคโนโลยีข้ามชาติและจีนรายใหญ่ ตัวอย่างเช่น รองประธานฝ่ายเทคโนโลยีเป็นสมาชิกรุ่นแรกๆ ของ Bard ของ Google และหัวหน้าสถาปนิกเป็นสมาชิกผู้ก่อตั้ง TensorFlow และทำงานร่วมกับนักวิจัยชื่อดังอย่าง Jeff Dean และ Samy Bengio ที่ Google Brain บุคคลสำคัญที่อยู่เบื้องหลัง Yi-34B ได้แก่ Wenhao Huang ผู้มีประสบการณ์จาก Microsoft Research Asia และ Ethan Dai ซึ่งดำรงตำแหน่งอาวุโสด้าน AI ที่ Huawei และ Alibaba

จากการให้การสนับสนุนยูนิคอร์นมากกว่า 10 แห่งและบริษัทร่วมลงทุนเจ็ดแห่งผ่าน Sinovation Ventures ทำให้ Lee เป็นหนึ่งในนักลงทุนและผู้ประกอบการที่มีความสัมพันธ์กันมากที่สุดในจีน

“คุณรู้ไหมว่า เป็นเวลากว่า 25 ปีแล้วนับตั้งแต่ก่อตั้ง Microsoft Research Asia และทุกสิ่งที่ฉันทำคือการได้รับพรสวรรค์ที่ยอดเยี่ยม” Lee ผู้ก่อตั้ง Microsoft Research Asia ซึ่งเป็นศูนย์วิจัยที่ใหญ่ที่สุดในต่างประเทศของยักษ์ใหญ่ในสหรัฐฯ กล่าว ก่อนที่จะเป็นหัวหอกใน Google China ในช่วงหลายปีที่ผ่านมา Microsoft Research Asia ได้รับชื่อเสียงในฐานะผู้สนับสนุนผู้ประกอบการด้าน AI ของจีน

“ตอนนี้ แน่นอนว่าคุณต้องการจ่ายเงินให้ผู้คนอย่างยุติธรรม และคุณต้องแข่งขันกับการจ่ายเงิน แต่ฉันคิดว่ามันเป็นเรื่องของคนที่เชื่อว่าพวกเขาสามารถสร้างความแตกต่างได้ และเชื่อว่าบริษัทสามารถประสบความสำเร็จได้” Lee กล่าวโดยปรากฏตัวใน วิดีโอคอลเวลา 21.30 น. เวลาปักกิ่ง. พนักงานของเขาก็มีแรงจูงใจในตนเองเช่นกัน ผู้เชี่ยวชาญด้านโครงสร้างพื้นฐานของสตาร์ทอัพคนหนึ่งทำงานได้ดีจนถึงช่วงเช้าของวันนั้น โดยยังคงส่งข้อความถึงลีเวลา 02:15 น. เพื่อแสดงความตื่นเต้นเกี่ยวกับการเป็นส่วนหนึ่งของภารกิจของ 01.AI

ไม่เป็นความลับเลยว่าการสร้าง LLM นั้นเป็นงานที่มีค่าใช้จ่ายสูง เพื่อรักษาการดำเนินงานที่ใช้เงินสดจำนวนมาก 01.AI จึงมีแผนสร้างรายได้ตั้งแต่เริ่มต้น แม้ว่าบริษัทจะยังคงเปิดโอเพ่นซอร์สในโมเดลบางรุ่นต่อไป แต่วัตถุประสงค์ของบริษัทคือการสร้างแบบจำลองอันล้ำสมัยที่เป็นกรรมสิทธิ์ซึ่งทำหน้าที่เป็นรากฐานสำหรับผลิตภัณฑ์เชิงพาณิชย์ที่หลากหลาย

“เราไม่สามารถโอเพ่นซอร์สได้ทุกอย่าง” Lee กล่าว “เราค่อนข้างทราบดีว่าโมเดลภาษาขนาดใหญ่เหล่านี้ต้องใช้การประมวลผลจำนวนมาก ดังนั้นจึงมีราคาแพงมาก เมื่อเราระดมเงินได้มาก ส่วนใหญ่จะใช้จ่ายกับ GPU ด้วยเหตุนี้ เราจึงต้องซื้อ GPU ให้ได้มากที่สุดก่อน ซึ่งเราก็ทำได้”

เช่นเดียวกับผู้เล่น LLM รายอื่นๆ ในประเทศจีน 01.AI ได้สะสม GPU เพื่อรอการคว่ำบาตรของสหรัฐฯ มันยืมเงินเพื่อซื้อโปรเซสเซอร์ก่อนที่จะได้รับเงินทุนด้วยซ้ำ ในปีที่ผ่านมา ฝ่ายบริหารของ Biden ได้เพิ่มข้อจำกัดในการเข้าถึงชิป AI ระดับไฮเอนด์ของจีน ส่งผลให้บริษัทจีนต้องจ่ายค่าชิปในราคาที่สูงเกินจริง การมองการณ์ไกลได้รับรางวัล — 01.AI มีอุปทานที่จะเพียงพอในอีกอย่างน้อย 12-18 เดือนข้างหน้า

นอกเหนือจากการสร้างความปวดหัวให้กับบริษัทจีนแล้ว การคว่ำบาตรของสหรัฐฯ ยังเป็นตัวเร่งให้เกิดนวัตกรรมโดยกระตุ้นให้พวกเขาใช้พลังการประมวลผลให้เกิดประโยชน์สูงสุด “ด้วยทีมงานโครงสร้างพื้นฐานที่มีคุณภาพสูงมาก สำหรับทุกๆ 1,000 GPU เราอาจจะสามารถบีบภาระงานของ GPU ได้ 2,000 ตัวออกจากพวกเขา” Lee กล่าว

01.เส้นทางสู่การสร้างรายได้ของ AI ขึ้นอยู่กับความสามารถในการค้นหาตลาดผลิตภัณฑ์ที่เหมาะกับโมเดล AI ที่มีราคาแพงเป็นหลัก แม้ว่านักวิทยาศาสตร์ LLM ระดับแนวหน้าจะขาดแคลน แต่ความสามารถด้านผลิตภัณฑ์ก็ไม่เคยขาดแคลนในประเทศจีน

“จีนไม่ได้นำหน้าสหรัฐอเมริกาในด้าน LLM แต่ไม่ต้องสงสัยเลยว่าจีนสามารถสร้างแอปพลิเคชันที่ดีกว่านักพัฒนาชาวอเมริกัน ส่วนใหญ่เป็นเพราะระบบนิเวศอินเทอร์เน็ตบนมือถืออันมหัศจรรย์ที่ถูกสร้างขึ้นในช่วง 12 ปีที่ผ่านมาหรือประมาณนั้น” Lee กล่าว

แม้ว่าผู้ก่อตั้งไม่ได้ให้รายละเอียดเกี่ยวกับบริการที่กำลังดำเนินการ แต่เขาบอกเป็นนัยว่าบริษัทกำลังทดลองแนวคิดในด้านประสิทธิภาพการทำงานและทิศทางทางสังคม และเขาจะ “ผิดหวัง” หาก 01.AI ไม่ปล่อยแอปภายในปีนี้

Lee กล่าวว่าเป้าหมายสูงสุดของการเริ่มต้นคือการกลายเป็นระบบนิเวศที่นักพัฒนาภายนอกสามารถสร้างแอปพลิเคชันได้อย่างง่ายดาย “หน้าที่ไม่ใช่แค่การผลักดันโมเดลการวิจัยที่ดีออกมาเท่านั้น แต่ที่สำคัญยิ่งกว่านั้นคือทำให้การพัฒนาแอพพลิเคชั่นเป็นเรื่องง่ายเพื่อให้มีแอพพลิเคชั่นที่น่าสนใจ” เขากล่าว “ในตอนท้าย มันเป็นเกมของระบบนิเวศ” เวลาจะบอกได้ว่าความพยายามด้าน AI ของ Lee จะได้ผลหรือไม่

view original *