งานวิจัยเทคโนโลยี A.I. สร้างภาพที่คนเคยเห็น ด้วยการสแกนสมองด้วยเครื่อง fMRI เริ่มจากการทดลองกับอาสาสมัคร 4 คน แม้จะยังอยู่ในช่วงเริ่มต้น แต่วันหนึ่งอาจช่วยให้ผู้คนสื่อสารหรือถอดรหัสความฝันได้ นักวิจัยกล่าว
แม้ว่าจะฟังดูคล้ายกับนิยายวิทยาศาสตร์ แต่นักวิจัยก็ประสบความสำเร็จในการฝึกอบรมระบบปัญญาประดิษฐ์เพื่อสร้างภาพที่ผู้คนเคยเห็น โดยการสแกนสมอง A.I. จะ สร้างรูปภาพของวัตถุต่างๆ เช่น ตุ๊กตาหมี หอนาฬิกา และเครื่องบิน ที่คนนั้นเคยเห็นภาพที่คล้ายกัน
“ความแม่นยำของวิธีการใหม่นี้น่าประทับใจมาก” Iris Groen นักประสาทวิทยาแห่งมหาวิทยาลัยอัมสเตอร์ดัม ให้ความเห็น
The technology, which was tested with four people, is still in its infancy but could one day help people communicate or decode dreams, researchers say
Though it sounds like something out of a science fiction novel, researchers have successfully trained an artificial intelligence system to recreate images people have looked at based on their brain scans. The A.I. generated pictures of objects including a teddy bear, clock tower and airplane after participants viewed similar images.
“The accuracy of this new method is impressive,” says Iris Groen, a neuroscientist at the University of Amsterdam who was not involved in the research, to Science’s Kamal Nahas.
A.I. สแกนสมอง เพื่อสร้างภาพที่ผู้คนเคยเห็น
ในขณะที่ ในงานวิจัย A.I. สามารถสแกนสมองอาสาสมัคร แล้วนำมาสร้างเป็นภาพที่เคยเห็นได้ แต่เทคโนโลยียังไม่พร้อมสำหรับการใช้งานสาธารณะ นักวิจัยกล่าวว่าสักวันหนึ่งเทคโนโลยีนี้อาจเป็นประโยชน์ เพื่อทำความเข้าใจสิ่งที่เกิดขึ้นภายในจิตใจของผู้คน เมื่อนักวิทยาศาสตร์ปรับปรุงแนวคิดนี้อีกเล็กน้อย ในที่สุดแพทย์อาจสามารถใช้ A.I. เพื่อช่วยผู้คน เช่น ช่วยผู้ป่วยอัมพาต ให้สามารถสื่อสารได้ นอกจากนี้ยังอาจช่วยให้นักประสาทวิทยาตีความความฝัน หรือแม้แต่เข้าใจว่าสิ่งมีชีวิตชนิดอื่นๆ รับรู้โลกรอบตัวอย่างไร
นักวิจัยจากมหาวิทยาลัยโอซาก้าในญี่ปุ่นเป็นหนึ่งในกลุ่มนักวิทยาศาสตร์ที่ใช้ A.I. เพื่อให้เข้าใจถึงความคิด โดยสแกนสมองของมนุษย์ อย่างไรก็ตาม แนวทางของพวกเขาในการทำเช่นนี้เป็นรายแรกที่ใช้ Stable Diffusion ตัวสร้างข้อความเป็นรูปภาพ ซึ่งมาจากเทคโนโลยี A.I. ที่เติบโตอย่างรวดเร็ว ในเดือนสิงหาคม พ.ศ. 2565 แบบจำลองของพวกเขายังง่ายกว่ามาก โดยต้องการพารามิเตอร์หรือค่าที่เรียนรู้ระหว่างการฝึกเพียงหลักพันแทนที่จะเป็นล้าน
ทีมงานได้แชร์รายละเอียดเพิ่มเติมในเอกสารงานวิจัยฉบับใหม่ ที่พวกเขาตั้งใจจะนำเสนอสิ่งที่ค้นพบในการประชุมคอมพิวเตอร์วิชั่นที่กำลังจะจัดขึ้น
แล้ว A.I. ทำงานอย่างไร? โดยทั่วไป ผู้ใช้ป้อนคำหรือวลีที่ Stable Diffusion—หรือเทคโนโลยีที่คล้ายคลึงกัน เช่น DALL-E 2 และ Midjourney—สามารถแปลงเป็นภาพ กระบวนการนี้ได้ผลเพราะ A.I. เทคโนโลยีได้ศึกษารูปภาพที่มีอยู่จำนวนมากและคำบรรยายประกอบภาพ เมื่อได้เทรนนิ่งด้วยดาต้าเซ็ตที่เพียงพอ ทำให้ A.I. สามารถระบุรูปได้ ซึ่งจะสร้างขึ้นใหม่ตามคำหรือวลีที่ป้อนข้อมูล
นักวิจัยได้พัฒนาการเทรนนิ่งนี้ไปอีกขั้นด้วยการสอนโมเดล A.I. ด้วยเอาท์พุตอิมเมจ จากเครื่อง functional magnetic resonance imaging (fMRI) โดยเฉพาะอย่างยิ่ง นักวิจัยใช้การสแกน fMRI ผู้เข้าร่วมการทดลอง 4 คน ซึ่งได้ภาพผู้คน ทิวทัศน์ และวัตถุต่างๆ กว่า 10,000 ภาพ ซึ่งเป็นส่วนหนึ่งของการศึกษาก่อนหน้านี้ที่ไม่เกี่ยวข้องกัน พวกเขายังฝึกฝน A.I. ตัวที่สองอีกด้วย แบบจำลองเพื่อเชื่อมโยงการทำงานของสมองในข้อมูล fMRI กับคำอธิบายรูปภาพที่ผู้เข้าร่วมการศึกษาเคยเห็น
โมเดลทั้งสองนี้ช่วยให้ Stable Diffusion เปลี่ยนข้อมูล fMRI เป็นภาพจำลองที่ค่อนข้างแม่นยำ ซึ่งไม่ได้เป็นส่วนหนึ่งของดาต้าเซ็ต จากการสแกนสมอง โมเดลแรกสามารถสร้างมุมมองและเลย์เอาต์ที่ผู้เข้าร่วมเคยเห็น แต่ภาพที่สร้างขึ้นนั้นเป็นตัวเลขที่ขุ่นมัวและไม่เฉพาะเจาะจง แต่แล้วโมเดลที่สองก็เริ่มต้นขึ้น และมันสามารถรับรู้ได้ว่าผู้คนกำลังดูวัตถุใดอยู่โดยใช้คำอธิบายข้อความจากภาพการฝึก ดังนั้น หากได้รับการสแกนสมองที่คล้ายกับสมองจากการฝึกฝนที่ทำเครื่องหมายว่าคนกำลังดูเครื่องบิน มันจะใส่เครื่องบินเข้าไปในภาพที่สร้างขึ้น ตามมุมมองของแบบจำลองแรก เทคโนโลยีนี้มีความแม่นยำประมาณ 80 เปอร์เซ็นต์
อันที่จริง ภาพที่สร้างขึ้นใหม่นั้นดูคล้ายกับต้นฉบับอย่างน่าประหลาด แม้ว่าจะมีความแตกต่างที่เห็นได้ชัดเจนอยู่บ้าง ตัวอย่างเช่น หัวรถจักรรุ่นที่สร้างโดย A.I. นั้น ยังคลุมเครือเหมือนถูกปกคลุมด้วยหมอก แทนที่จะแสดงท้องฟ้าสีฟ้าสดใสเหมือนภาพจริง และการพรรณนาหอนาฬิกาของ A.I. ดูเหมือนงานศิลปะนามธรรมมากกว่าภาพถ่ายจริง
เทคโนโลยีแสดงให้เห็นข้อจำกัดบางประการ สามารถสร้างได้เฉพาะภาพของวัตถุที่มีในดาต้าเซ็ตที่เทรนนิ่งไว้เท่านั้น และเนื่องจาก A.I. ประมวลผลการทำงานของสมองของคนเพียง 4 คน การขยายให้ครอบคลุมถึงคนอื่นๆ จำเป็นต้องฝึกฝนแบบจำลองในการสแกนสมองของแต่ละคนใหม่ ซึ่งเป็นกระบวนการที่มีราคาแพงและใช้เวลานาน ด้วยเหตุนี้ เทคโนโลยีดังกล่าวจึงไม่น่าจะเข้าถึงประชาชนได้อย่างกว้างขวางในปัจจุบัน
Sikun Lin นักวิทยาศาสตร์คอมพิวเตอร์จาก University of California Santa Barbara กล่าวว่า “วิธีนี้ใช้ไม่ได้ผลในชีวิตประจำวันเลย” กล่าวกับ Carissa Wong จาก New Scientist
ผู้คนทั่วไป ยังกังวลเกี่ยวกับ A.I. เช่น ประเด็นการขโมยผลงานศิลปิน หรือละเมิดกฎหมายลิขสิทธิ์หรือไม่? A.I. อาจจะทำให้ตำรวจมีอคติกับคนบางกลุ่มมากขึ้น ให้ข้อมูลผิดๆ หรือบุกรุกความเป็นส่วนตัวของเราหรือไม่? วิศวกรและนักจริยธรรมยังคงต่อสู้กับคำถามเหล่านี้และคำถามอื่นๆ อีกมากมาย และการอภิปรายเหล่านี้น่าจะดำเนินต่อไปในอนาคตอันใกล้ แม้ในขณะที่นักวิทยาศาสตร์คิดค้นวิธีการใช้ A.I. ที่แปลกใหม่และนำมาใช้ประโยชน์
“เมื่อพูดถึงเทคโนโลยีอันทรงพลัง —และเห็นได้ชัดว่า A.I. จะเป็นหนึ่งในเทคโนโลยีที่ทรงพลังที่สุดเท่าที่เคยมีมา เราต้องระวัง” เดมิส ฮาสซาบิส ซีอีโอของ A.I. กล่าว ห้องปฏิบัติการวิจัย DeepMind ถึง Billy Perrigo ของนิตยสาร Time เมื่อปีที่แล้ว “เหมือนกับว่า นักวิจัยพัฒนา A.I. หลายคนไม่ตระหนักว่า กำลังทดลองวิจัยวัตถุอันตรายอย่างมากอยู่