Why China remains hungry for AI chips despite US restrictions

ความต้องการโปรเซสเซอร์ของ Nvidia นั้นอ่อนตัวลงสำหรับตลาดจีน แต่ Nvidia ยังคงมีประสิทธิภาพมากกว่าทางเลือกอื่น

Nvidia’s processors are weakened for the Chinese market, but are still more powerful than the alternatives

เหตุใดจีนยังคงมีความต้องการชิป AI สูง แม้ว่าสหรัฐฯ จะวางข้อกำหนดเพื่อกีดกันก็ตาม

เมื่อปีที่แล้ว สหรัฐฯ ดำเนินการอย่างแข็งกร้าวเพื่อจำกัดความสามารถของจีนในการพัฒนาปัญญาประดิษฐ์เพื่อวัตถุประสงค์ทางการทหาร โดยขัดขวางการขายชิปที่ทันสมัยที่สุดของสหรัฐฯ ที่ใช้ในการฝึกระบบ AI

ความก้าวหน้าครั้งใหญ่ของชิปที่ใช้ในการพัฒนา generative AI หมายความว่าเทคโนโลยีล่าสุดของสหรัฐอเมริกาที่วางขายในจีนนั้นทรงพลังมากกว่าที่เคยมีมา แม้ว่าสหรัฐอเมริกาจงใจกีดกันตลาดจีนเพื่อจำกัดความสามารถในการพัฒนา AI ของจีน ซึ่งทำให้จีนได้ใช้งานชิปที่มีประสิทธิภาพน้อยกว่าผลิตภัณฑ์ที่มีอยู่ในที่อื่น ๆ ในโลก

ผลลัพธ์ที่ได้ทำให้คำสั่งซื้อโปรเซสเซอร์ขั้นสูงล่าสุดของสหรัฐฯ ของจีนเพิ่มสูงขึ้น บริษัทอินเทอร์เน็ตชั้นนำของจีนได้สั่งซื้อชิปมูลค่า 5 พันล้านดอลลาร์จาก Nvidia ซึ่งหน่วยประมวลผลกราฟิกได้กลายมาเป็นกลไกในการฝึกโมเดล AI ขนาดใหญ่

ผลกระทบของความต้องการทั่วโลกที่เพิ่มขึ้นสำหรับผลิตภัณฑ์ของ Nvidia มีแนวโน้มที่จะหนุนผลประกอบการทางการเงินในไตรมาสที่สองของผู้ผลิตชิปเนื่องจากมีการประกาศในวันพุธ

นอกจากสะท้อนให้เห็นถึงความต้องการชิปที่ได้รับการปรับปรุงเพื่อฝึกอบรมโมเดลภาษาขนาดใหญ่ล่าสุดของบริษัทอินเทอร์เน็ตแล้ว ความเร่งรีบยังได้รับแจ้งจากความกังวลว่าสหรัฐฯ อาจเข้มงวดการควบคุมการส่งออกมากขึ้น ซึ่งทำให้แม้แต่ผลิตภัณฑ์ที่จำกัดเหล่านี้จะไม่สามารถใช้งานได้ในอนาคต

อย่างไรก็ตาม Bill Dally หัวหน้านักวิทยาศาสตร์ของ Nvidia แนะนำว่าการควบคุมการส่งออกของสหรัฐฯ จะมีผลกระทบมากขึ้นในอนาคต

“เนื่องจากข้อกำหนดในการฝึกอบรม (สำหรับระบบ AI ที่ทันสมัยที่สุด) ยังคงเพิ่มขึ้นเป็นสองเท่าทุกๆ หกถึง 12 เดือน” ช่องว่างระหว่างชิปที่ขายในจีนและที่มีจำหน่ายในส่วนที่เหลือของโลก “จะเติบโตอย่างรวดเร็ว” เขากล่าว

การกำหนดความเร็วการประมวลผลสูงสุด

การควบคุมการส่งออกชิปของสหรัฐฯ ในปีที่แล้วเป็นส่วนหนึ่งของแพ็คเกจที่รวมถึงการป้องกันไม่ให้ลูกค้าชาวจีนซื้ออุปกรณ์ที่จำเป็นในการผลิตชิปขั้นสูง

วอชิงตันกำหนดขีดจำกัดความเร็วการประมวลผลสูงสุดของชิปที่สามารถขายในจีนได้ เช่นเดียวกับอัตราที่ชิปสามารถถ่ายโอนข้อมูลได้ ซึ่งเป็นปัจจัยสำคัญในการฝึกอบรมโมเดล AI ขนาดใหญ่ ซึ่งเป็นงานที่ต้องใช้ข้อมูลมาก การเชื่อมต่อชิปจำนวนมากเข้าด้วยกัน

Nvidia ตอบสนองด้วยการลดอัตราการถ่ายโอนข้อมูลบนโปรเซสเซอร์ A100 ซึ่งเป็น GPU ระดับแนวหน้าในขณะนั้น โดยสร้างผลิตภัณฑ์ใหม่สำหรับจีนที่เรียกว่า A800 เพื่อควบคุมการส่งออกเทคโนโลยีที่สำคัญอย่างยิ่ง

ในปีนี้ H100 ได้ปฏิบัติตามข้อจำกัดในการถ่ายโอนข้อมูล ซึ่งเป็นโปรเซสเซอร์ใหม่ที่ทรงพลังกว่ามากซึ่งได้รับการออกแบบมาเป็นพิเศษเพื่อฝึกโมเดลภาษาขนาดใหญ่ โดยสร้างเวอร์ชันที่เรียกว่า H800 สำหรับตลาดจีน

ผู้ผลิตชิปไม่ได้เปิดเผยความสามารถทางเทคนิคของโปรเซสเซอร์ที่ผลิตสำหรับจีน แต่ผู้ผลิตคอมพิวเตอร์ได้เปิดเผยรายละเอียดแล้ว ตัวอย่างเช่น Lenovo โฆษณาเซิร์ฟเวอร์ที่มีชิป H800 ซึ่งระบุว่าเหมือนกันทุกประการกับ H100 ที่ขายในที่อื่น ๆ ในโลก ยกเว้นว่าจะมีอัตราการถ่ายโอนเพียง 400 กิกะไบต์ต่อวินาที

ซึ่งต่ำกว่าขีดจำกัด 600 GB/s ที่สหรัฐฯ กำหนดไว้สำหรับการส่งออกชิปไปยังจีน จากการเปรียบเทียบ Nvidia ได้กล่าวว่า H100 ซึ่งเริ่มจัดส่งให้กับลูกค้าเมื่อต้นปีนี้มีอัตราการถ่ายโอน 900 GB/s

อัตราการถ่ายโอนที่ต่ำกว่าในประเทศจีนหมายความว่าผู้ใช้ชิปต้องเผชิญกับเวลาการฝึกอบรมสำหรับระบบ AI ของพวกเขานานกว่าลูกค้าของ Nvidia ที่อื่น ๆ ในโลก ซึ่งเป็นข้อจำกัดที่สำคัญเนื่องจากโมเดลมีขนาดใหญ่ขึ้น

ระยะเวลาการฝึกอบรมที่ยาวนานขึ้นจะทำให้ต้นทุนเพิ่มขึ้น เนื่องจากชิปจะต้องใช้พลังงานมากขึ้น ซึ่งเป็นหนึ่งในค่าใช้จ่ายที่ใหญ่ที่สุดสำหรับโมเดลขนาดใหญ่

อย่างไรก็ตาม แม้จะมีข้อจำกัดเหล่านี้ ชิป H800 ที่จำหน่ายในประเทศจีนก็ยังมีประสิทธิภาพมากกว่าที่อื่นๆ ที่มีวางจำหน่ายก่อนปีนี้ ซึ่งนำไปสู่ความต้องการอย่างมาก

ชิป H800 นั้นเร็วกว่าชิป A100 ถึงห้าเท่าซึ่งเป็น GPU ที่ทรงพลังที่สุดของ Nvidia ตามที่ Patrick Moorhead นักวิเคราะห์ชิปของสหรัฐอเมริกาจาก Moor Insights & Strategy กล่าว

นั่นหมายความว่าบริษัทอินเทอร์เน็ตของจีนที่ฝึกฝนโมเดล AI ของตนโดยใช้ชิปชั้นนำที่ซื้อก่อนที่การควบคุมการส่งออกของสหรัฐฯ ยังคงคาดหวังการปรับปรุงครั้งใหญ่โดยการซื้อเซมิคอนดักเตอร์รุ่นล่าสุด เขากล่าว

“ดูเหมือนว่ารัฐบาลสหรัฐฯ ไม่ต้องการปิดกั้นความพยายามด้าน AI ของจีน เพียงแต่ทำให้ยากขึ้น” มัวร์เฮดกล่าว

จุดคุ้มทุน

บริษัทเทคโนโลยีจีนหลายแห่งยังอยู่ในขั้นตอนของการฝึกอบรมโมเดลภาษาขนาดใหญ่ล่วงหน้า ซึ่งทำให้ชิป GPU แต่ละตัวสูญเสียประสิทธิภาพไปมาก และต้องการความสามารถในการถ่ายโอนข้อมูลในระดับสูง

มีเพียงชิปของ Nvidia เท่านั้นที่สามารถให้ประสิทธิภาพที่จำเป็นสำหรับการฝึกอบรมล่วงหน้า วิศวกร AI ของจีนกล่าว ประสิทธิภาพของชิปแต่ละตัวของซีรีส์ 800 แม้จะมีความเร็วในการถ่ายโอนลดลง แต่ก็ยังเหนือกว่าชิปอื่นๆ ในตลาด

“GPU ของ Nvidia อาจดูมีราคาแพง แต่จริงๆ แล้วเป็นตัวเลือกที่คุ้มค่าที่สุด” วิศวกร AI คนหนึ่งของบริษัทอินเทอร์เน็ตชั้นนำของจีนกล่าว

ผู้จำหน่าย GPU รายอื่นเสนอราคาที่ต่ำกว่าพร้อมการบริการที่ตรงเวลามากขึ้น วิศวกรกล่าว แต่บริษัทตัดสินว่าค่าใช้จ่ายในการฝึกอบรมและการพัฒนาจะเพิ่มขึ้น และจะมีภาระความไม่แน่นอนเพิ่มเติม

ข้อเสนอของ Nvidia รวมถึง software ecosystem ด้วยแพลตฟอร์มคอมพิวเตอร์ Compute Unified Device Architecture หรือ Cuda ที่จัดตั้งขึ้นในปี 2549 และได้กลายเป็นส่วนหนึ่งของโครงสร้างพื้นฐาน AI

นักวิเคราะห์อุตสาหกรรมเชื่อว่าบริษัทจีนอาจเผชิญกับข้อจำกัดในเรื่องความเร็วของการเชื่อมต่อระหว่างชิปซีรีส์ 800 ในไม่ช้า สิ่งนี้อาจเป็นอุปสรรคต่อความสามารถในการจัดการกับปริมาณข้อมูลที่เพิ่มขึ้นซึ่งจำเป็นสำหรับการฝึกอบรม AI และพวกเขาจะถูกขัดขวางเมื่อพวกเขาเจาะลึกมากขึ้นในการค้นคว้าและพัฒนาแบบจำลองภาษาขนาดใหญ่

Charlie Chai นักวิเคราะห์จาก 86Research ในเซี่ยงไฮ้ เปรียบเทียบสถานการณ์กับการสร้างโรงงานหลายแห่งที่มีมอเตอร์เวย์ติดขัดระหว่างกัน แม้แต่บริษัทที่สามารถรองรับชิปที่อ่อนแอลงก็อาจประสบปัญหาภายในสองหรือสามปีข้างหน้า เขากล่าวเสริม

view original *