Researchers use large language models to help robots navigate
วิธีการนี้ใช้ language-based inputs อินพุตด้วยการบรรยายเป็นภาษาแทนข้อมูลภาพ (visual data) ที่มีราคาแพง เพื่อสั่งหุ่นยนต์ผ่านงานการนำทางแบบหลายขั้นตอน The method uses language-based inputs instead of costly visual data to direct a robot through a multistep navigation task. นักวิจัยใช้ large language model ร่วมกับ visual เพื่อพัฒนา navigation performance ของหุ่นยนต์ให้มีประสิทธิภาพดีขึ้น สักวันหนึ่ง คุณอาจต้องการให้หุ่นยนต์ช่วยงานบ้านของคุณขนเสื้อผ้าใช้แล้วจำนวนหนึ่ง ลงบันได แล้วนำเสื้อผ้าไปใส่ในเครื่องซักผ้า ที่ตั้งอยู่มุมซ้ายสุดของห้องใต้ดิน หุ่นยนต์จะต้องรวมคำสั่งของคุณเข้ากับ visual observations เพื่อกำหนดขั้นตอนที่ควรดำเนินการเพื่อทำงานนี้ให้สำเร็จ สำหรับAI agent พูดง่ายกว่าทำ แนวทางในปัจจุบันมักใช้ machine-learning models ที่สร้างขึ้นโดยเฉพาะหลายแบบ เพื่อจัดการกับส่วนต่างๆ ของงาน […]