Creating and verifying stable AI-controlled systems in a rigorous and flexible way

Neural network controllers รับประกันเสถียรภาพให้กับหุ่นยนต์ที่ซับซ้อน ซึ่งปูทางไปสู่การใช้งานยานพาหนะอัตโนมัติและเครื่องจักรอุตสาหกรรมที่ปลอดภัยยิ่งขึ้น

Neural network controllers provide complex robots with stability guarantees, paving the way for the safer deployment of autonomous vehicles and industrial machines.

การสร้างและตรวจสอบ stable AI-controlled systems ด้วยวิธีที่เข้มงวดและยืดหยุ่น

โครงข่ายประสาทเทียม (Neural networks) ส่งผลกระทบต่อวิธีที่วิศวกรออกแบบตัวควบคุมสำหรับหุ่นยนต์ ช่วยให้เครื่องจักรปรับตัว และมีประสิทธิภาพมากขึ้น ถึงกระนั้น ระบบการเรียนรู้ด้วยเครื่องจักรที่เหมือนสมอง ก็เป็นดาบสองคม  ความซับซ้อนของระบบทำให้ทรงพลัง แต่ก็ทำให้ยากต่อการรับประกันว่าหุ่นยนต์ที่ขับเคลื่อนโดยโครงข่ายประสาทเทียมจะบรรลุภารกิจได้อย่างปลอดภัย

วิธีดั้งเดิมในการตรวจสอบความปลอดภัย และเสถียรภาพ คือการใช้เทคนิคที่เรียกว่า Lyapunov functions หากคุณพบฟังก์ชันเลียปูนอฟที่มีค่าลดลงอย่างต่อเนื่อง คุณจะทราบได้ว่าสถานการณ์ที่ไม่ปลอดภัย หรือไม่เสถียร ที่เกี่ยวข้องกับค่าที่สูงกว่า จะไม่เกิดขึ้น สำหรับหุ่นยนต์ที่ควบคุมโดยโครงข่ายประสาทเทียม วิธีการก่อนหน้านี้ในการตรวจสอบเงื่อนไขของ Lyapunov ไม่ได้ปรับขนาดได้ดีกับเครื่องจักรที่ซับซ้อน

นักวิจัยจากห้องปฏิบัติการวิทยาการคอมพิวเตอร์และปัญญาประดิษฐ์ (CSAIL) ของ MIT และที่อื่นๆ ได้พัฒนาเทคนิคใหม่ๆ ที่จะรับรองการคำนวณของ Lyapunov ในระบบที่ซับซ้อนมากขึ้นอย่างเข้มงวด อัลกอริธึมของพวกเขาค้นหาและตรวจสอบฟังก์ชัน Lyapunov ได้อย่างมีประสิทธิภาพ โดยรับประกันความเสถียรของระบบ แนวทางนี้อาจช่วยให้สามารถใช้งานหุ่นยนต์และยานพาหนะอัตโนมัติได้อย่างปลอดภัยยิ่งขึ้น รวมถึงเครื่องบินและยานอวกาศ

เพื่อให้มีประสิทธิภาพเหนือกว่าอัลกอริธึมก่อนหน้านี้ นักวิจัยพบทางลัด ที่ช่วยให้ประหยัดขึ้นสำหรับกระบวนการฝึกอบรมและการตรวจสอบ พวกเขาสร้างตัวอย่างตอบโต้ที่ราคาถูกกว่า เช่น ข้อมูลฝ่ายตรงข้ามจากเซ็นเซอร์ที่อาจหลุดออกจากคอนโทรลเลอร์ จากนั้นจึงปรับระบบหุ่นยนต์ให้เหมาะสมเพื่อคำนึงถึงสิ่งเหล่านั้น การทำความเข้าใจ edge cases เงื่อนไขเฉพาะเหล่านี้ ช่วยให้เครื่องจักรเรียนรู้วิธีจัดการกับสถานการณ์ที่ท้าทาย ซึ่งช่วยให้สามารถทำงานได้อย่างปลอดภัยในสภาวะต่างๆ ที่กว้างกว่าที่เคยเป็นไปได้ จากนั้น พวกเขาได้พัฒนาสูตรการตรวจสอบใหม่ที่ช่วยให้สามารถใช้ตัวตรวจสอบโครงข่ายประสาทเทียมที่ปรับขนาดได้ α, β-CROWN เพื่อให้การรับประกันสถานการณ์ที่เลวร้ายที่สุดอย่างเข้มงวดนอกเหนือจากตัวอย่างที่โต้แย้งกัน

“เราได้เห็นประสิทธิภาพเชิงประจักษ์ที่น่าประทับใจในเครื่องจักรที่ควบคุมโดย AI เช่น หุ่นยนต์คล้ายมนุษย์ และหุ่นยนต์สุนัข แต่ตัวควบคุม AI เหล่านี้ขาดการรับประกันอย่างน่าเชื่อถือ ซึ่งมีความสำคัญอย่างยิ่งต่อระบบที่มีความสำคัญต่อความปลอดภัย” Lujie Yang วิศวกรรมไฟฟ้าและวิทยาการคอมพิวเตอร์ของ MIT กล่าว (EECS ) นักศึกษาปริญญาเอกและบริษัทในเครือ CSAIL ซึ่งเป็นผู้เขียนร่วมของรายงานใหม่เกี่ยวกับโครงการนี้ร่วมกับนักวิจัยจากสถาบันวิจัย Toyota  Hongkai Dai SM ’12, PhD ’16 “งานของเราเชื่อมช่องว่างระหว่างประสิทธิภาพในระดับนั้นจากตัวควบคุมโครงข่ายประสาทเทียมและการรับประกันความปลอดภัยที่จำเป็นในการปรับใช้ตัวควบคุมโครงข่ายประสาทเทียมที่ซับซ้อนมากขึ้นในโลกแห่งความเป็นจริง” Yang กล่าว

สำหรับการสาธิตแบบดิจิทัล ทีมงานได้จำลองว่าโดรนสี่ใบพัดพร้อมเซ็นเซอร์ลิดาร์ (lidar sensors) จะทรงตัวในสภาพแวดล้อมสองมิติได้อย่างไร อัลกอริธึมของพวกเขาประสบความสำเร็จในการนำโดรนไปยังตำแหน่งโฮเวอร์ที่มั่นคง โดยใช้ข้อมูลสิ่งแวดล้อมที่จำกัดจากเซ็นเซอร์ลิดาร์เท่านั้น ในการทดลองอื่นอีกสองครั้ง วิธีการของพวกเขาทำให้ระบบหุ่นยนต์จำลองสองระบบสามารถทำงานได้อย่างเสถียรในสภาวะที่หลากหลายมากขึ้น ได้แก่ ลูกตุ้มกลับหัว (inverted pendulum) และยานพาหนะติดตามเส้นทาง (path-tracking vehicle) การทดลองเหล่านี้แม้จะเรียบง่าย แต่ก็ค่อนข้างซับซ้อนมากกว่าที่ชุมชนการตรวจสอบโครงข่ายประสาทเทียมสามารถทำได้ก่อนหน้านี้ โดยเฉพาะอย่างยิ่งเนื่องจากมีโมเดลเซ็นเซอร์รวมอยู่ด้วย

“ไม่เหมือนกับปัญหาการเรียนรู้ของเครื่องทั่วไป การใช้โครงข่ายประสาทเทียมอย่างเข้มงวดในฐานะฟังก์ชัน Lyapunov จำเป็นต้องแก้ไขปัญหาการเพิ่มประสิทธิภาพระดับโลกอย่างหนัก และด้วยเหตุนี้ความสามารถในการปรับขนาดจึงเป็นปัญหาคอขวดที่สำคัญ” Sicun Gao รองศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์และวิศวกรรมศาสตร์จากมหาวิทยาลัยแคลิฟอร์เนียที่ San Diego  กล่าว ซึ่งไม่ได้เกี่ยวข้องกับงานนี้ “งานในปัจจุบันมีส่วนสนับสนุนที่สำคัญโดยการพัฒนาแนวทางอัลกอริธึมที่ได้รับการปรับให้เหมาะกับการใช้งานโครงข่ายประสาทเทียมมากขึ้นเนื่องจาก Lyapunov ทำหน้าที่ในการควบคุมปัญหา มีการปรับปรุงที่น่าประทับใจในด้านความสามารถในการปรับขนาดและคุณภาพของโซลูชันเหนือแนวทางที่มีอยู่ งานนี้เปิดทางที่น่าตื่นเต้นสำหรับการพัฒนาอัลกอริธึมการปรับให้เหมาะสมสำหรับวิธีการของระบบประสาท Lyapunov และการใช้การเรียนรู้เชิงลึกอย่างเข้มงวดในการควบคุมและหุ่นยนต์โดยทั่วไป”

แนวทางการรักษาความมั่นคงของ Yang และเพื่อนร่วมงานของเธอมีความเป็นไปได้ในการใช้งานที่หลากหลาย ซึ่งการรับประกันความปลอดภัยถือเป็นสิ่งสำคัญ มันสามารถช่วยรับประกันการขับขี่ที่ราบรื่นยิ่งขึ้นสำหรับยานยนต์อัตโนมัติ เช่น เครื่องบินและยานอวกาศ ในทำนองเดียวกันโดรนส่งสินค้าหรือทำแผนที่ภูมิประเทศที่แตกต่างกันอาจได้รับประโยชน์จากการรับประกันความปลอดภัยดังกล่าว

เทคนิคที่พัฒนาขึ้นที่นี่มีความทั่วไปมากและไม่ได้เฉพาะเจาะจงกับวิทยาการหุ่นยนต์เท่านั้น เทคนิคเดียวกันนี้อาจช่วยในการใช้งานอื่นๆ ได้ เช่น ชีวการแพทย์ และการแปรรูปทางอุตสาหกรรม ในอนาคต

แม้ว่าเทคนิคนี้จะเป็นการอัพเกรดจากงานก่อนหน้านี้ในแง่ของความสามารถในการขยายขนาด นักวิจัยกำลังสำรวจว่าเทคนิคนี้จะทำงานได้ดีขึ้นในระบบที่มีขนาดสูงขึ้นได้อย่างไร พวกเขายังต้องคำนึงถึงข้อมูลที่นอกเหนือจากการอ่านค่าไลดาร์ เช่น รูปภาพ และ point clouds

สำหรับทิศทางการวิจัยในอนาคต ทีมงานต้องการให้การรับประกันเสถียรภาพแบบเดียวกันสำหรับระบบที่อยู่ในสภาพแวดล้อมที่ไม่แน่นอนและอาจถูกรบกวน ตัวอย่างเช่น หากโดรนเผชิญกับลมกระโชกแรง Yang และเพื่อนร่วมงานของเธอต้องการให้แน่ใจว่าโดรนจะยังคงบินได้อย่างมั่นคงและบรรลุภารกิจที่ต้องการ 

นอกจากนี้ พวกเขาตั้งใจที่จะใช้วิธีการของตนกับปัญหาการปรับให้เหมาะสม โดยมีเป้าหมายเพื่อลดเวลาและระยะทางที่หุ่นยนต์ต้องใช้ในการทำงานให้สำเร็จโดยยังคงนิ่งอยู่ พวกเขาวางแผนที่จะขยายเทคนิคของพวกเขาไปยังหุ่นยนต์ฮิวแมนนอยด์และเครื่องจักรอื่นๆ ในโลกแห่งความเป็นจริง ซึ่งหุ่นยนต์จำเป็นต้องรักษาเสถียรภาพในขณะที่ติดต่อกับสภาพแวดล้อม

Russ Tedrake ศาสตราจารย์ Toyota แห่ง EECS การบินและอวกาศ และวิศวกรรมเครื่องกลที่ MIT รองประธานฝ่ายวิจัยหุ่นยนต์ที่ TRI และสมาชิก CSAIL เป็นผู้เขียนอาวุโสของงานวิจัยนี้ บทความนี้ยังให้เครดิตนักศึกษาปริญญาเอกจากมหาวิทยาลัยแคลิฟอร์เนียที่ลอสแอนเจลิส Zhouxing Shi และรองศาสตราจารย์ Cho-Jui Hsieh รวมถึงผู้ช่วยศาสตราจารย์ Huan Zhang จากมหาวิทยาลัยอิลลินอยส์แห่ง Urbana-Champaign งานของพวกเขาได้รับการสนับสนุนบางส่วนโดย Amazon, มูลนิธิวิทยาศาสตร์แห่งชาติ, สำนักงานวิจัยกองทัพเรือ และโครงการ AI2050 ที่ Schmidt Sciences บทความของนักวิจัยจะถูกนำเสนอในการประชุมนานาชาติเรื่องการเรียนรู้ของเครื่องปี 2024

view original *