AI’s Victories in Go Inspire Better Human Game Playing

การศึกษาใหม่ยืนยันว่าผู้เล่น Human Go ปรับปรุงการเล่นเกมของพวกเขาหลังจากเผชิญกับความท้าทายของ AlphaGo โดยการพัฒนากลยุทธ์ใหม่ที่นำไปสู่การตัดสินใจที่มีคุณภาพดีขึ้นในการเล่นเกมของพวกเขา การศึกษายังพบว่าคุณภาพการตัดสินใจของมนุษย์ยังคงสม่ำเสมอเป็นเวลา 66 ปีก่อนที่ AI จะเอาชนะแชมป์ Go ของมนุษย์ได้ อย่างไรก็ตาม หลังจากที่ AlphaGo เอาชนะ Sedol ผู้ท้าชิงที่เป็นมนุษย์ในปี 2016 และผู้ท้าชิงที่เป็นมนุษย์อีกชุดในปี 2017 คะแนนคุณภาพการตัดสินใจก็เริ่มสูงขึ้น คะแนนความแปลกใหม่ยังเพิ่มขึ้นหลังจากปี 2559-2560 จากมนุษย์ที่นำเสนอการเคลื่อนไหวใหม่ในเกมก่อนหน้านี้ในระหว่างลำดับการเล่นเกม ผลการวิจัยชี้ให้เห็นว่ามนุษย์จะปรับตัวและต่อยอดจากการค้นพบเหล่านี้เพื่อเพิ่มศักยภาพอย่างมหาศาล

Lee Se-Dol ผู้เล่น Go มืออาชีพชาวเกาหลีใต้วิจารณ์การแข่งขันกับผู้เล่น Go มืออาชีพคนอื่น ๆ หลังจากการแข่งขันครั้งที่สี่กับ AlphaGo โปรแกรมปัญญาประดิษฐ์ของ Google ในระหว่างการแข่งขัน Google DeepMind Challenge Match เมื่อวันที่ 13 มีนาคม 2016 ในกรุงโซล ประเทศเกาหลีใต้ เครดิต: รูปภาพ Google / Getty

A new study confirms that human Go players improved their gameplay after facing the AlphaGo challenge by developing new strategies that led to better-quality decisions in their game play. The study also found that human decision quality stayed pretty uniform for 66 years before AI beat human Go champions. However, after AlphaGo beat its human challenger Sedol in 2016 and another series of human challengers in 2017, decision quality scores began to climb. Novelty scores also shot up after 2016-2017 from humans introducing new moves into games earlier during the game play sequence. The results suggest that humans will adapt and build upon these discoveries to massively increase their potential.

ชัยชนะของ AI ใน Go สร้างแรงบันดาลใจให้การเล่นเกมของมนุษย์ดีขึ้น

ในปี 2559 คอมพิวเตอร์ชื่อ AlphaGo ได้พาดหัวข่าวเกี่ยวกับการเอาชนะ Lee Sedol แชมป์โลกในขณะนั้นในเกมกลยุทธ์โบราณยอดนิยม Go ปัญญาประดิษฐ์ “เหนือมนุษย์” ที่พัฒนาโดย Google DeepMind แพ้ Sedol เพียงหนึ่งในห้ารอบ ทำให้เกิดการเปรียบเทียบกับหมากรุกของ Garry Kasparov ในปี 1997 ที่แพ้ Deep Blue ของ IBM เกมโกะซึ่งให้ผู้เล่นเผชิญหน้ากันด้วยการเดินหมากขาวดำที่เรียกว่าหินโดยมีเป้าหมายเพื่อครอบครองดินแดนบนกระดานเกม ถูกมองว่าเป็นความท้าทายที่ยากยิ่งสำหรับคู่ต่อสู้ที่เป็นเครื่องจักรมากกว่าหมากรุก

ความเจ็บปวดอย่างมากเกี่ยวกับการคุกคามของ AI ต่อความเฉลียวฉลาดและการดำรงชีวิตของมนุษย์ตามหลังชัยชนะของ AlphaGo ไม่ต่างจากสิ่งที่เกิดขึ้นในตอนนี้กับ ChatGPT และเครือญาติ ในการแถลงข่าวในปี 2559 หลังจากการสูญเสีย Sedol ที่ถูกทำให้อ่อนลงได้เสนอความคิดเห็นด้วยแง่บวก “สไตล์ของมันแตกต่างออกไป และเป็นประสบการณ์ที่ไม่ธรรมดาเลย ซึ่งผมต้องใช้เวลาปรับตัว” เขากล่าว “AlphaGo ทำให้ฉันรู้ว่าฉันต้องศึกษา Go ให้มากขึ้น”

ในเวลานั้น Fan Hui แชมป์ European Go ซึ่งแพ้ AlphaGo ในรอบส่วนตัว 5 เกมให้กับ AlphaGo เมื่อหลายเดือนก่อน บอกกับ Wired ว่าแมตช์ดังกล่าวทำให้เขามองเกม “แตกต่างไปจากเดิมอย่างสิ้นเชิง” สิ่งนี้ปรับปรุงการเล่นของเขาอย่างมากจนอันดับโลกของเขา “พุ่งสูงขึ้น” ตาม Wired

การติดตามกระบวนการตัดสินใจที่ยุ่งเหยิงของมนุษย์อย่างเป็นทางการอาจเป็นเรื่องยาก แต่บันทึกการเคลื่อนไหวของผู้เล่น Go มืออาชีพที่ยาวนานหลายทศวรรษทำให้นักวิจัยมีวิธีการประเมินการตอบสนองเชิงกลยุทธ์ของมนุษย์ต่อการยั่วยุของ AI การศึกษาใหม่ยืนยันว่าการปรับปรุงของ Fan Hui หลังจากเผชิญกับความท้าทายของ AlphaGo ไม่ใช่แค่ความบังเอิญเพียงอย่างเดียว ในปี 2560 หลังจากที่ AI ชนะอย่างน่าสมเพชในปี 2559 ผู้เล่น Human Go สามารถเข้าถึงข้อมูลรายละเอียดการเคลื่อนไหวที่ทำโดยระบบ AI และพัฒนากลยุทธ์ใหม่ๆ ในแนวทางที่เหมือนมนุษย์มาก ซึ่งนำไปสู่การตัดสินใจที่มีคุณภาพดีขึ้นในการเล่นเกมของพวกเขา การยืนยันการเปลี่ยนแปลงในการเล่นเกมของมนุษย์ปรากฏในการค้นพบที่เผยแพร่เมื่อวันที่ 13 มีนาคมในรายงานการประชุมของ National Academy of Sciences สหรัฐอเมริกา

David Silver นักวิทยาศาสตร์การวิจัยหลักของ DeepMind และหัวหน้าโครงการ AlphaGo ผู้ไม่ได้มีส่วนร่วมในการศึกษากล่าวว่า “เป็นเรื่องน่าทึ่งที่เห็นว่าผู้เล่นที่เป็นมนุษย์ได้ปรับตัวอย่างรวดเร็วเพื่อรวมการค้นพบใหม่เหล่านี้เข้ากับเกมของพวกเขาเอง” “ผลลัพธ์เหล่านี้ชี้ให้เห็นว่ามนุษย์จะปรับตัวและสร้างการค้นพบเหล่านี้เพื่อเพิ่มศักยภาพอย่างมหาศาล”

เพื่อระบุว่าการกำเนิดของ AI เหนือมนุษย์ผลักดันให้มนุษย์สร้างกลยุทธ์ใหม่สำหรับการเล่นเกมหรือไม่ Minkyu Shin ผู้ช่วยศาสตราจารย์ภาควิชาการตลาดที่ City University of Hong Kong และเพื่อนร่วมงานของเขาใช้ฐานข้อมูล 5.8 ล้านการเคลื่อนไหวที่บันทึกไว้ระหว่างเกมจาก 1950 ถึงปี 2021 บันทึกนี้เก็บรักษาไว้ที่เว็บไซต์ Games of Go on Download สะท้อนทุกความเคลื่อนไหวของเกม Go ที่เล่นในทัวร์นาเมนต์ย้อนกลับไปในศตวรรษที่ 19 นักวิจัยเริ่มวิเคราะห์เกมตั้งแต่ปี 1950 เป็นต้นมา เนื่องจากเป็นปีที่มีการสร้างกฎ Go ยุคใหม่

ในการเริ่มรวมสถิติการเคลื่อนที่ของเกมจำนวนมหาศาลถึง 5.8 ล้านครั้ง ทีมงานได้สร้างวิธีการให้คะแนนคุณภาพของการตัดสินใจสำหรับการเคลื่อนไหวแต่ละครั้งก่อน เพื่อพัฒนาดัชนีนี้ นักวิจัยใช้ระบบ AI อีกระบบหนึ่งคือ KataGo เพื่อเปรียบเทียบอัตราการชนะของการตัดสินใจของมนุษย์แต่ละครั้งกับการตัดสินใจของ AI การวิเคราะห์ขนาดใหญ่นี้เกี่ยวข้องกับการจำลอง 10,000 วิธีที่เกมสามารถเล่นได้หลังจากการตัดสินใจแต่ละครั้งจาก 5.8 ล้านครั้งของมนุษย์

ด้วยคะแนนคุณภาพสำหรับการตัดสินใจของมนุษย์แต่ละครั้ง นักวิจัยจึงพัฒนาวิธีการที่จะระบุได้อย่างแม่นยำว่าเมื่อใดที่การตัดสินใจของมนุษย์ในระหว่างเกมเป็นเรื่องแปลกใหม่ ซึ่งหมายความว่าไม่เคยมีการบันทึกมาก่อนในประวัติศาสตร์ของเกม ผู้เล่นหมากรุกใช้วิธีการที่คล้ายกันมานานแล้วในการตัดสินว่ากลยุทธ์ใหม่ในการเล่นเกมจะเกิดขึ้นเมื่อใด

ในการวิเคราะห์ความแปลกใหม่ของการเล่นเกม Go นักวิจัยได้แมปถึง 60 ท่าสำหรับแต่ละเกม และทำเครื่องหมายเมื่อมีการแนะนำท่าใหม่ ถ้ามันเกิดขึ้นที่ เช่น ขยับเก้าในเกมหนึ่ง แต่ไม่ถึงจนกว่าจะขยับ 15 ในอีกเกมหนึ่ง เกมก่อนหน้าจะมีคะแนนดัชนีความแปลกใหม่สูงกว่าเกมหลัง Shin และเพื่อนร่วมงานของเขาพบว่าหลังจากปี 2017 การเคลื่อนไหวส่วนใหญ่ที่ทีมระบุว่าเป็นเรื่องแปลกใหม่เกิดขึ้นจากการเคลื่อนไหว 35

จากนั้น นักวิจัยพิจารณาว่าจังหวะของการเคลื่อนที่แบบใหม่ในการเล่นเกมติดตามด้วยคุณภาพการตัดสินใจที่เพิ่มขึ้นหรือไม่ การเคลื่อนไหวดังกล่าวช่วยเพิ่มความได้เปรียบของผู้เล่นบนกระดานและโอกาสในการชนะหรือไม่ โดยเฉพาะอย่างยิ่งพวกเขาต้องการดูว่าเกิดอะไรขึ้นกับคุณภาพการตัดสินใจ (หากมีสิ่งใดเกิดขึ้น) หลังจากที่ AlphaGo เอาชนะ Sedol ผู้ท้าชิงที่เป็นมนุษย์ในปี 2016 และผู้ท้าชิงที่เป็นมนุษย์อีกชุดในปี 2017

ทีมงานพบว่าก่อนที่ AI จะเอาชนะแชมป์ Go ของมนุษย์ได้ ระดับคุณภาพการตัดสินใจของมนุษย์ยังคงสม่ำเสมอมาเป็นเวลา 66 ปี หลังจากช่วงเวลาแห่งโชคชะตาในปี 2559-2560 คะแนนคุณภาพการตัดสินใจก็เริ่มสูงขึ้น มนุษย์เลือกเล่นเกมได้ดีขึ้น อาจจะไม่เพียงพอที่จะเอาชนะ AI เหนือมนุษย์ได้อย่างต่อเนื่อง แต่ก็ยังดีกว่า

คะแนนความแปลกใหม่ยังเพิ่มขึ้นหลังจากปี 2559–2560 จากมนุษย์ที่นำเสนอการเคลื่อนไหวใหม่ในเกมก่อนหน้านี้ระหว่างลำดับการเล่นเกม และในการประเมินความเชื่อมโยงระหว่างการเคลื่อนไหวที่แปลกใหม่กับการตัดสินใจที่มีคุณภาพดีขึ้น Shin และเพื่อนร่วมงานของเขาพบว่าก่อนที่ AlphaGo จะประสบความสำเร็จในการต่อสู้กับผู้เล่นที่เป็นมนุษย์ การเคลื่อนไหวที่แปลกใหม่ของมนุษย์นั้นมีส่วนช่วยในการตัดสินใจที่มีคุณภาพดีโดยเฉลี่ยน้อยกว่าการเคลื่อนไหวที่ไม่แปลกใหม่ หลังจากที่ AI อันเป็นที่จดจำเหล่านี้ได้รับชัยชนะ นวนิยายเรื่องดังกล่าวจะย้ายมนุษย์เข้าสู่เกมโดยมีส่วนเฉลี่ยมากกว่าการเคลื่อนไหวที่ทราบกันดีอยู่แล้วเพื่อให้ได้คะแนนคุณภาพการตัดสินใจที่ดีขึ้น

คำอธิบายหนึ่งที่เป็นไปได้สำหรับการปรับปรุงเหล่านี้คือมนุษย์กำลังจดจำลำดับการเคลื่อนไหวการเล่นใหม่ ในการศึกษา Shin และเพื่อนร่วมงานยังได้ประเมินว่าการท่องจำสามารถอธิบายคุณภาพการตัดสินใจได้มากน้อยเพียงใด นักวิจัยพบว่าการท่องจำไม่สามารถอธิบายการปรับปรุงคุณภาพการตัดสินใจได้อย่างสมบูรณ์ และ “ไม่น่าเป็นไปได้” ที่จะรองรับความแปลกใหม่ที่เพิ่มขึ้นหลังปี 2559-2560

Murat Kantarcioglu ศาสตราจารย์ด้านวิทยาการคอมพิวเตอร์แห่งมหาวิทยาลัยเทกซัส เมืองดัลลาส กล่าวว่า การค้นพบนี้ เมื่อรวมกับงานที่เขาและคนอื่นๆ ทำแล้ว แสดงให้เห็นว่า “เห็นได้ชัดว่า AI สามารถช่วยปรับปรุงการตัดสินใจของมนุษย์ได้” Kantarcioglu ซึ่งไม่ได้เกี่ยวข้องกับการศึกษาในปัจจุบันกล่าวว่าความสามารถของ AI ในการประมวลผล “พื้นที่ค้นหาที่กว้างใหญ่” เช่น การเคลื่อนไหวที่เป็นไปได้ทั้งหมดในเกมที่ซับซ้อนเช่น Go หมายความว่า AI สามารถ “ค้นหาวิธีแก้ปัญหาและแนวทางใหม่ๆ ” ตัวอย่างเช่น AI ที่ระบุว่าภาพทางการแพทย์บ่งชี้ว่าเป็นมะเร็งอาจทำให้แพทย์ต้องดูแลอย่างใกล้ชิดมากกว่าที่เคยเป็นมา “สิ่งนี้จะทำให้บุคคลนั้นเป็นแพทย์ที่ดีขึ้นและป้องกันความผิดพลาดเช่นนี้ในอนาคต” เขากล่าว

ข้อผูกมัด—ดังที่โลกกำลังประสบกับ ChatGPT—คือปัญหาของการทำให้ AI น่าเชื่อถือมากขึ้น Kantarcioglu กล่าวเสริม “ผมเชื่อว่านี่คือความท้าทายหลัก” เขากล่าว

ในช่วงใหม่ของข้อกังวลเกี่ยวกับ ChatGPT และ AI อื่นๆ การค้นพบนี้นำเสนอ “มุมมองที่มีความหวัง” เกี่ยวกับศักยภาพของ AI ในการเป็นพันธมิตรแทนที่จะเป็น “ศัตรูที่อาจเกิดขึ้นในการเดินทางสู่ความก้าวหน้าและดียิ่งขึ้น” Shin และผู้เขียนร่วมของเขา เขียนในอีเมลถึง Scientific American

“ผู้เขียนร่วมของฉันและฉันกำลังทำการทดลองในห้องปฏิบัติการออนไลน์เพื่อสำรวจว่ามนุษย์สามารถปรับปรุงการแจ้งเตือนและบรรลุผลลัพธ์ที่ดีขึ้นจากโปรแกรมเหล่านี้ได้อย่างไร” ชินกล่าว “แทนที่จะมองว่า AI เป็นภัยคุกคามต่อสติปัญญาของมนุษย์ เราควรยอมรับมันว่าเป็นเครื่องมืออันมีค่าที่จะช่วยเพิ่มความสามารถของเรา”

เขียนโดย Emily Willingham

View Original