ความต้องการโปรเซสเซอร์ของ Nvidia นั้นอ่อนตัวลงสำหรับตลาดจีน แต่ Nvidia ยังคงมีประสิทธิภาพมากกว่าทางเลือกอื่น
Nvidia’s processors are weakened for the Chinese market, but are still more powerful than the alternatives
เหตุใดจีนยังคงมีความต้องการชิป AI สูง แม้ว่าสหรัฐฯ จะวางข้อกำหนดเพื่อกีดกันก็ตาม
เมื่อปีที่แล้ว สหรัฐฯ ดำเนินการอย่างแข็งกร้าวเพื่อจำกัดความสามารถของจีนในการพัฒนาปัญญาประดิษฐ์เพื่อวัตถุประสงค์ทางการทหาร โดยขัดขวางการขายชิปที่ทันสมัยที่สุดของสหรัฐฯ ที่ใช้ในการฝึกระบบ AI
ความก้าวหน้าครั้งใหญ่ของชิปที่ใช้ในการพัฒนา generative AI หมายความว่าเทคโนโลยีล่าสุดของสหรัฐอเมริกาที่วางขายในจีนนั้นทรงพลังมากกว่าที่เคยมีมา แม้ว่าสหรัฐอเมริกาจงใจกีดกันตลาดจีนเพื่อจำกัดความสามารถในการพัฒนา AI ของจีน ซึ่งทำให้จีนได้ใช้งานชิปที่มีประสิทธิภาพน้อยกว่าผลิตภัณฑ์ที่มีอยู่ในที่อื่น ๆ ในโลก
ผลลัพธ์ที่ได้ทำให้คำสั่งซื้อโปรเซสเซอร์ขั้นสูงล่าสุดของสหรัฐฯ ของจีนเพิ่มสูงขึ้น บริษัทอินเทอร์เน็ตชั้นนำของจีนได้สั่งซื้อชิปมูลค่า 5 พันล้านดอลลาร์จาก Nvidia ซึ่งหน่วยประมวลผลกราฟิกได้กลายมาเป็นกลไกในการฝึกโมเดล AI ขนาดใหญ่
ผลกระทบของความต้องการทั่วโลกที่เพิ่มขึ้นสำหรับผลิตภัณฑ์ของ Nvidia มีแนวโน้มที่จะหนุนผลประกอบการทางการเงินในไตรมาสที่สองของผู้ผลิตชิปเนื่องจากมีการประกาศในวันพุธ
นอกจากสะท้อนให้เห็นถึงความต้องการชิปที่ได้รับการปรับปรุงเพื่อฝึกอบรมโมเดลภาษาขนาดใหญ่ล่าสุดของบริษัทอินเทอร์เน็ตแล้ว ความเร่งรีบยังได้รับแจ้งจากความกังวลว่าสหรัฐฯ อาจเข้มงวดการควบคุมการส่งออกมากขึ้น ซึ่งทำให้แม้แต่ผลิตภัณฑ์ที่จำกัดเหล่านี้จะไม่สามารถใช้งานได้ในอนาคต
อย่างไรก็ตาม Bill Dally หัวหน้านักวิทยาศาสตร์ของ Nvidia แนะนำว่าการควบคุมการส่งออกของสหรัฐฯ จะมีผลกระทบมากขึ้นในอนาคต
“เนื่องจากข้อกำหนดในการฝึกอบรม (สำหรับระบบ AI ที่ทันสมัยที่สุด) ยังคงเพิ่มขึ้นเป็นสองเท่าทุกๆ หกถึง 12 เดือน” ช่องว่างระหว่างชิปที่ขายในจีนและที่มีจำหน่ายในส่วนที่เหลือของโลก “จะเติบโตอย่างรวดเร็ว” เขากล่าว
การกำหนดความเร็วการประมวลผลสูงสุด
การควบคุมการส่งออกชิปของสหรัฐฯ ในปีที่แล้วเป็นส่วนหนึ่งของแพ็คเกจที่รวมถึงการป้องกันไม่ให้ลูกค้าชาวจีนซื้ออุปกรณ์ที่จำเป็นในการผลิตชิปขั้นสูง
วอชิงตันกำหนดขีดจำกัดความเร็วการประมวลผลสูงสุดของชิปที่สามารถขายในจีนได้ เช่นเดียวกับอัตราที่ชิปสามารถถ่ายโอนข้อมูลได้ ซึ่งเป็นปัจจัยสำคัญในการฝึกอบรมโมเดล AI ขนาดใหญ่ ซึ่งเป็นงานที่ต้องใช้ข้อมูลมาก การเชื่อมต่อชิปจำนวนมากเข้าด้วยกัน
Nvidia ตอบสนองด้วยการลดอัตราการถ่ายโอนข้อมูลบนโปรเซสเซอร์ A100 ซึ่งเป็น GPU ระดับแนวหน้าในขณะนั้น โดยสร้างผลิตภัณฑ์ใหม่สำหรับจีนที่เรียกว่า A800 เพื่อควบคุมการส่งออกเทคโนโลยีที่สำคัญอย่างยิ่ง
ในปีนี้ H100 ได้ปฏิบัติตามข้อจำกัดในการถ่ายโอนข้อมูล ซึ่งเป็นโปรเซสเซอร์ใหม่ที่ทรงพลังกว่ามากซึ่งได้รับการออกแบบมาเป็นพิเศษเพื่อฝึกโมเดลภาษาขนาดใหญ่ โดยสร้างเวอร์ชันที่เรียกว่า H800 สำหรับตลาดจีน
ผู้ผลิตชิปไม่ได้เปิดเผยความสามารถทางเทคนิคของโปรเซสเซอร์ที่ผลิตสำหรับจีน แต่ผู้ผลิตคอมพิวเตอร์ได้เปิดเผยรายละเอียดแล้ว ตัวอย่างเช่น Lenovo โฆษณาเซิร์ฟเวอร์ที่มีชิป H800 ซึ่งระบุว่าเหมือนกันทุกประการกับ H100 ที่ขายในที่อื่น ๆ ในโลก ยกเว้นว่าจะมีอัตราการถ่ายโอนเพียง 400 กิกะไบต์ต่อวินาที
ซึ่งต่ำกว่าขีดจำกัด 600 GB/s ที่สหรัฐฯ กำหนดไว้สำหรับการส่งออกชิปไปยังจีน จากการเปรียบเทียบ Nvidia ได้กล่าวว่า H100 ซึ่งเริ่มจัดส่งให้กับลูกค้าเมื่อต้นปีนี้มีอัตราการถ่ายโอน 900 GB/s
อัตราการถ่ายโอนที่ต่ำกว่าในประเทศจีนหมายความว่าผู้ใช้ชิปต้องเผชิญกับเวลาการฝึกอบรมสำหรับระบบ AI ของพวกเขานานกว่าลูกค้าของ Nvidia ที่อื่น ๆ ในโลก ซึ่งเป็นข้อจำกัดที่สำคัญเนื่องจากโมเดลมีขนาดใหญ่ขึ้น
ระยะเวลาการฝึกอบรมที่ยาวนานขึ้นจะทำให้ต้นทุนเพิ่มขึ้น เนื่องจากชิปจะต้องใช้พลังงานมากขึ้น ซึ่งเป็นหนึ่งในค่าใช้จ่ายที่ใหญ่ที่สุดสำหรับโมเดลขนาดใหญ่
อย่างไรก็ตาม แม้จะมีข้อจำกัดเหล่านี้ ชิป H800 ที่จำหน่ายในประเทศจีนก็ยังมีประสิทธิภาพมากกว่าที่อื่นๆ ที่มีวางจำหน่ายก่อนปีนี้ ซึ่งนำไปสู่ความต้องการอย่างมาก
ชิป H800 นั้นเร็วกว่าชิป A100 ถึงห้าเท่าซึ่งเป็น GPU ที่ทรงพลังที่สุดของ Nvidia ตามที่ Patrick Moorhead นักวิเคราะห์ชิปของสหรัฐอเมริกาจาก Moor Insights & Strategy กล่าว
นั่นหมายความว่าบริษัทอินเทอร์เน็ตของจีนที่ฝึกฝนโมเดล AI ของตนโดยใช้ชิปชั้นนำที่ซื้อก่อนที่การควบคุมการส่งออกของสหรัฐฯ ยังคงคาดหวังการปรับปรุงครั้งใหญ่โดยการซื้อเซมิคอนดักเตอร์รุ่นล่าสุด เขากล่าว
“ดูเหมือนว่ารัฐบาลสหรัฐฯ ไม่ต้องการปิดกั้นความพยายามด้าน AI ของจีน เพียงแต่ทำให้ยากขึ้น” มัวร์เฮดกล่าว
จุดคุ้มทุน
บริษัทเทคโนโลยีจีนหลายแห่งยังอยู่ในขั้นตอนของการฝึกอบรมโมเดลภาษาขนาดใหญ่ล่วงหน้า ซึ่งทำให้ชิป GPU แต่ละตัวสูญเสียประสิทธิภาพไปมาก และต้องการความสามารถในการถ่ายโอนข้อมูลในระดับสูง
มีเพียงชิปของ Nvidia เท่านั้นที่สามารถให้ประสิทธิภาพที่จำเป็นสำหรับการฝึกอบรมล่วงหน้า วิศวกร AI ของจีนกล่าว ประสิทธิภาพของชิปแต่ละตัวของซีรีส์ 800 แม้จะมีความเร็วในการถ่ายโอนลดลง แต่ก็ยังเหนือกว่าชิปอื่นๆ ในตลาด
“GPU ของ Nvidia อาจดูมีราคาแพง แต่จริงๆ แล้วเป็นตัวเลือกที่คุ้มค่าที่สุด” วิศวกร AI คนหนึ่งของบริษัทอินเทอร์เน็ตชั้นนำของจีนกล่าว
ผู้จำหน่าย GPU รายอื่นเสนอราคาที่ต่ำกว่าพร้อมการบริการที่ตรงเวลามากขึ้น วิศวกรกล่าว แต่บริษัทตัดสินว่าค่าใช้จ่ายในการฝึกอบรมและการพัฒนาจะเพิ่มขึ้น และจะมีภาระความไม่แน่นอนเพิ่มเติม
ข้อเสนอของ Nvidia รวมถึง software ecosystem ด้วยแพลตฟอร์มคอมพิวเตอร์ Compute Unified Device Architecture หรือ Cuda ที่จัดตั้งขึ้นในปี 2549 และได้กลายเป็นส่วนหนึ่งของโครงสร้างพื้นฐาน AI
นักวิเคราะห์อุตสาหกรรมเชื่อว่าบริษัทจีนอาจเผชิญกับข้อจำกัดในเรื่องความเร็วของการเชื่อมต่อระหว่างชิปซีรีส์ 800 ในไม่ช้า สิ่งนี้อาจเป็นอุปสรรคต่อความสามารถในการจัดการกับปริมาณข้อมูลที่เพิ่มขึ้นซึ่งจำเป็นสำหรับการฝึกอบรม AI และพวกเขาจะถูกขัดขวางเมื่อพวกเขาเจาะลึกมากขึ้นในการค้นคว้าและพัฒนาแบบจำลองภาษาขนาดใหญ่
Charlie Chai นักวิเคราะห์จาก 86Research ในเซี่ยงไฮ้ เปรียบเทียบสถานการณ์กับการสร้างโรงงานหลายแห่งที่มีมอเตอร์เวย์ติดขัดระหว่างกัน แม้แต่บริษัทที่สามารถรองรับชิปที่อ่อนแอลงก็อาจประสบปัญหาภายในสองหรือสามปีข้างหน้า เขากล่าวเสริม