Light-Based Computing Revolution: Powering ChatGPT-Type Machine Learning Programs with Enhanced Optical Neural Networks

เพิ่มความสามารถของ ChatGPT ในการผลิตเรียงความ อีเมล และโปรแกรมมิ่งโค้ด ด้วยคำสั่งภาษาธรรมชาติง่ายๆ ได้ดึงดูดความสนใจจากนานาชาติ นักวิจัยจาก MIT ได้รายงานวิธีการที่มีศักยภาพ สำหรับโปรแกรมแมชชีนเลิร์นนิงที่เพิ่มความสามารถโปรแกรมใช้งาน ChatGPT ได้หลายเท่า นอกจากนี้ เทคโนโลยีของพวกเขาอาจใช้พลังงานน้อยกว่าซูเปอร์คอมพิวเตอร์ล้ำสมัยที่ขับเคลื่อนโมเดลแมชชีนเลิร์นนิงในปัจจุบัน

ChatGPT’s capacity to produce polished essays, emails, and code in response to a few simple inquiries has garnered international attention. Researchers at MIT has reported a method that has the potential to pave the way for machine-learning programs many times more capable than the one responsible for ChatGPT. Furthermore, their technology might consume less energy than the state-of-the-art supercomputers powering today’s machine-learning models.

Light-Based Computing Revolution: เพิ่มพลัง ChatGPT-Type Machine Learning Programs ด้วยเครือข่ายใยแก้วนำแสง Enhanced Optical Neural Networks

เพิ่มความสามารถของ ChatGPT ในการผลิตเรียงความ อีเมล และโปรแกรมมิ่งโค้ด ด้วยคำสั่งภาษาธรรมชาติง่ายๆ ได้ดึงดูดความสนใจจากนานาชาติ นักวิจัยจาก MIT ได้รายงานวิธีการที่มีศักยภาพ สำหรับโปรแกรมแมชชีนเลิร์นนิงที่เพิ่มความสามารถโปรแกรมใช้งาน ChatGPT ได้หลายเท่า นอกจากนี้ เทคโนโลยีของพวกเขาอาจใช้พลังงานน้อยกว่าซูเปอร์คอมพิวเตอร์ล้ำสมัยที่ขับเคลื่อนโมเดลแมชชีนเลิร์นนิงในปัจจุบัน

ทีมงานรายงานการสาธิตการทดลองครั้งแรกของระบบใหม่ ซึ่งใช้เลเซอร์ขนาดหลายร้อยไมครอนในการคำนวณตามการเคลื่อนที่ของแสงมากกว่าอิเล็กตรอน ระบบใหม่นี้ประหยัดพลังงานมากกว่าคอมพิวเตอร์ดิจิทัลที่ทันสมัยกว่า 100 เท่าสำหรับการเรียนรู้ของเครื่อง และมีประสิทธิภาพมากกว่า 25 เท่า ในด้านความหนาแน่นของการประมวลผล

ยิ่งไปกว่านั้น พวกเขาสังเกตเห็นว่า “ยังมีอีกหลายลำดับความสำคัญสำหรับการปรับปรุงในอนาคต” นักวิทยาศาสตร์กล่าวเสริมว่า “เปิดช่องทางให้กับโปรเซสเซอร์ออปโตอิเล็กทรอนิกส์ขนาดใหญ่เพื่อเร่งงานการเรียนรู้ของเครื่องตั้งแต่ศูนย์ข้อมูลไปจนถึงอุปกรณ์ปลายทางที่กระจายอำนาจ” ในอนาคต อุปกรณ์ขนาดเล็กเช่นโทรศัพท์มือถืออาจสามารถเรียกใช้โปรแกรมที่สามารถประมวลผลได้ที่ศูนย์ข้อมูลขนาดใหญ่เท่านั้น

โมเดลแมชชีนเลิร์นนิงขนาดใหญ่ที่เลียนแบบการประมวลผลข้อมูลของสมองเป็นพื้นฐานของ deep neural networks (DNN) เช่นเดียวกับ ChatGPT ที่ขับเคลื่อน ในขณะที่แมชชีนเลิร์นนิงกำลังขยายตัว เทคโนโลยีดิจิทัลที่ขับเคลื่อน DNN ในปัจจุบันกำลังอยู่ในภาวะที่ราบสูง นอกจากนี้ มักพบเฉพาะในศูนย์ข้อมูลขนาดใหญ่เท่านั้นเนื่องจากความต้องการพลังงานสูงมาก สิ่งนี้กำลังขับเคลื่อนนวัตกรรมในสถาปัตยกรรมคอมพิวเตอร์

ระเบียบวินัยของวิทยาศาสตร์ข้อมูลกำลังพัฒนาเนื่องจากการเพิ่มขึ้นของ deep neural networks (DNN) เพื่อตอบสนองต่อการขยายตัวแบบทวีคูณของ DNN เหล่านี้ ซึ่งกำลังเก็บภาษีความสามารถของฮาร์ดแวร์คอมพิวเตอร์แบบดั้งเดิม เครือข่ายนิวรัลแบบออปติก optical neural networks (ONN) ได้พัฒนาเมื่อเร็วๆ นี้เพื่อดำเนินการงาน DNN ที่อัตราสัญญาณนาฬิกาสูง ในแบบคู่ขนาน และทำให้ข้อมูลสูญหายน้อยที่สุด ประสิทธิภาพการแปลงอิเล็กโทรออปติกต่ำ รอยเท้าอุปกรณ์ขนาดใหญ่ และครอสทอล์คของช่องสัญญาณทำให้ความหนาแน่นของการประมวลผลต่ำใน ONN ในขณะที่การขาดความไม่เชิงเส้นแบบอินไลน์ทำให้เกิดความล่าช้าอย่างมาก นักวิจัยได้ทดลองแสดง spatial-temporal-multiplexed ONN system เพื่อแก้ไขปัญหาเหล่านี้ทั้งหมดในคราวเดียว พวกเขาใช้การเข้ารหัสเซลล์ประสาทโดยใช้อาร์เรย์ระดับไมโครเมตร (micrometer-scale arrays) ของ vertical-cavity surface-emitting lasers (VCSEL) ซึ่งสร้างขึ้นในปริมาณมากและแสดงการแปลงแสงไฟฟ้าที่ยอดเยี่ยม

เป็นครั้งแรกที่นักวิจัยจัดทำการออกแบบขนาดเล็กที่สามารถแก้ไขปัญหาทั้งสามนี้ได้พร้อมกัน การรับรู้ระยะไกล LiDAR สมัยใหม่และการพิมพ์ด้วยเลเซอร์ต่างก็ใช้สถาปัตยกรรมนี้ ซึ่งสร้างขึ้นจากอาร์เรย์ของ VCSEL มาตรการเหล่านี้ดูเหมือนจะเป็นการปรับปรุงสองลำดับความสำคัญในอนาคตอันใกล้นี้ โปรเซสเซอร์ออปโตอิเล็กทรอนิกส์มอบโอกาสใหม่ในการเร่งความเร็วกระบวนการเรียนรู้ของเครื่องทั่วทั้งโครงสร้างพื้นฐานแบบรวมศูนย์และแบบกระจาย

view original *