3 เหตุผลที่ AI วาดมือได้เน่ามาก

พงษ์ระพี เตชพาหพงษ์ ผลงานที่สร้างโดย Generative Art ไม่ว่าจะเป็น MidJourney, Dall-E หรือตัวอื่นๆ ได้สร้างความตกตะลึงในผลงาน จากแค่พิมพ์ข้อความเข้าไปไม่กี่คำที่เรียกว่า Prompt ทั้งแสงเงา สี แพทเทิร์น ฟอร์ม ลายเส้น รายละเอียดและอื่นๆก็โผล่ขึ้นมาในช่วงเวลาแค่อึดใจราวกับเสกเวทมนต์ แต่มีเพียงไม่กี่สิ่งเท่านั้น ที่ทำให้เราเบ้ปากกับผลงานที่ออกมา เรียกได้ว่าตรงกันข้ามสิ่งที่กล่าวออกมาเมื่อสักครู่นี้โดยเส้นเชิง สิ่งที่ว่านั้นก็คือ “มือ” ผู้ใช้อาร์ทสาย AI หลายคน บอกว่าวิธีดูภาพที่สร้างมาจาก คนวาด หรือ AI ทำ ดูง่ายๆ ให้ดูที่มือ เพราะมือที่สร้างจาก AI จำนวนไม่น้อยมันผิดปกติ มีหกนิ้วบ้าง โค้งงอผิดรูปบ้าง ไปจนถึงหลอมรวมสองมือเข้าด้วยกันบ้าง เหมือนกับคนในภาพเป็นคนพิการอย่างไงอย่างงั้น คำถามก็มีอยู่ว่า ทำไม AI ที่สร้างสรรค์ภาพดั่งเทพเสกเวทมนต์ ถึงทำมือได้เน่าขนาดนี้… คำตอบมีอยู่ 3 ข้อด้วยกัน 3.Low Margin for Errorไม่น่าเชื่อว่า ท่าทางของมือที่เพี้ยนไปเล็กน้อยนั้นจะสะดุดตาคนเป็นอย่างมาก เช่นนิ้วงอผิดฝั่ง การหยิบจับที่แปลกไปเล็กน้อย […]

เส้นทาง ChatGPT

ระบบการศึกษาตั้งแต่โบราณ ครูอาจารย์มักจะให้ความสำคัญกับที่ไปที่มา ประวัติศาสตร์และแรงบันดาลใจของคนคิดค่อนข้างน้อย ไปจนถึงตัดบทไม่กล่าวถึงเลย โดยเฉพาะเรื่องคณิตศาสตร์และวิทยาศาสตร์ ยุคหลังๆมาฟังอจป๋องแป๋ง ที่นิยามตัวเองเป็นนักสื่อสารวิทยาศาสตร์และเล่าเรื่องราวของคนคิด ปัญหาที่เจอ การค้นพบ มันช่วยสร้างแรงบันดาลใจเป็นอย่างมาก และทำให้เราเข้าใจตัวหลักคิดทฤษฏี ทั้งที่ยังไม่แสดงสมการสักตัว ผมเองมองประวัติศาสตร์ไม่ต่างจากแคลคูลัส (เคยเขียนบทความเรื่องนี้ไปแล้ว) เพราะมันคือการเลือกจุดที่สนใจแล้วดูการเปลี่ยนแปลงหลังจากนั้น พร้อมกับตีความบนเส้นเรื่อง เพื่อค่อยๆแกะความหมายระหว่างบรรทัดออกมา ผมค้นพบว่ามันทำให้จำได้นานโดยไม่ต้องท่อง เข้าใจได้ลึกโดยยังไม่ได้ไปดูสูตร ผมก็เลยอยากชักชวนทุกคนที่ศึกษาเรื่อง AI & Machine Learning ลองทำแบบนี้ดูบ้าง ถ้าคิดว่าแนวคิดแบบนี้พอใช้ได้ เส้นทางของพัฒนาการ AI นี่น่าทึ่ง ถ้าย้อนไปไกลๆจะนับได้ถึงปี 1600+ ยุคกูเต็นเบิร์กพอดี อัศจรรย์มาก และในช่วงสงครามโลกครั้งที่สอง Alan Turing (นักถอดรหัสระดับตำนาน มีเป็นหนังด้วยนะชื่อ The Immitation แสดงโดยคนแสดงดอกเตอร์สเตรนจ์) ก็เคยพูดถึง Machine Intelligence ด้วย แต่ AI ที่คนทั่วโลกรู้จักกันมากๆก็คือ ปี 1997 ตอนที่เครื่องคอมพิวเตอร์ IBM ที่ชื่อ DeepBlue สามารถชนะแชมป์โลกหมากรุกได้ […]

ทำไมกูเกิลถึงตามหลังเรื่อง AI?

พงษ์ระพี เตชพาหพงษ์ ทำไมกูเกิลถึงตามหลังเรื่อง AI? กูเกิลรวยล้นฟ้า มีทรัพยากรมากมาย เป็นเจ้าแห่งค้นและข้อมูล เปเปอร์สะเทือนโลกด้าน AI อย่างสถาปัตยกรรม Transformer ก็มาจากคนของกูเกิล แต่ทำไม ทำไม!… AI ถึงตามชาวบ้าน ออกก็ช้า งานก็แป๊ก สำหรับคนวงนอกอย่างผม ผมไม่เชื่อว่าระดับกูเกิลจะคิด และสร้างของดีออกมาไม่ได้ โดยเฉพาะต้องมานั่งตาม Startup No Name อย่าง OpenAI สิ่งเดียวที่คิดได้ และน่าจะเป็นสาเหตุหลักก็คือ Business Model ของกูเกิลมันขัดแย้งกับ ChatBot ถ้ามองให้รวบยอดและใช้คำพูดกระชับหน่อย ก็ต้องบอกว่า ธุรกิจของกูเกิลก็คือ “การขายคลิก” คนค้นเยอะ คลิกเยอะ เงินก็ไหลเข้ามาเยอะ และนี่คือกระแสเงินหลักของกูเกิลที่ได้มาตลอดหลายสิบปี ลองคิดดู ถ้าวันหนึ่งผู้ใช้จำนวนมาก มานั่งคิดว่า เวลาค้นอะไรแต่ละที ทำไมต้องไปคลิกด้วยวะ มันควรจะได้คำตอบเลยหรือเปล่า หรืออย่างน้อยก็ควรได้แนวทางคร่าวๆในหน้าแรกเลย ถ้าผู้ใช้ “ตื่นรู้” เรื่องนี้ แล้วเลิกสนใจ “วิธีการค้นแล้วคลิก” ความฉิบหายก็จะเดินทางมาเยือนหัวกระไดบ้านกูเกิลทันที ไอ้ครั้นจะมาเก็บค่าสมาชิกแบบ […]

หนึ่งในสิ่งที่ทำให้ออตโตมานล่มสลาย

พงษ์ระพี เตชพาหพงษ์ อจ Yann LeCun จัดหนักทวีตอีกรอบเรื่องที่มีคนเรียกร้องให้หยุดพัฒนา AI 6 เดือน โดยครั้งนี้แกยกประวัติศาสตร์จักรวรรดิออตโตมาน ที่รุ่งเรืองสุดในช่วงปี 1400+ โดยเฉพาะเมเหมดที่สอง ที่ถล่มเมืองคอนสแตนติโนเบิลได้ และปิดฉากจักรวรรดิโรมันที่ยิ่งใหญ่นับพันปี (ใครสนใจไปดูซีรีย์ใน netflix นะ มีสองซีซันละ) แต่ในช่วงเวลานั้นเป็นช่วงที่กูเต็นเบิร์กคิดค้นแท่นพิมพ์ได้สำเร็จ ในเวลาไม่กี่สิบปีหลังจากนั้น ทำให้เกิดสำนักพิมพ์ โรงพิมพ์มากมาย หนังสืออกมาทะลัก ความรู้ต่างๆก็เริ่มเดินทางไปทั่วโลก แต่แปลกออตโตมานกลับกลัวหนังสือ กลัวชาวบ้านมีความรู้ กลัวเรื่องความเชื่อศาสนาจะสั่นครอน กลัวชาวบ้านฉลาดขึ้นกว่าคนส่วนน้อยในกำแพง ก็เลยออกกฏ จำกัดการครอบครองหนังสือ ทำให้หนังสือหายาก มีราคาแพง หวังให้ชาวบ้านโง่ดังเดิม แต่นั่นหารู้ไม่ว่าอีกฟากหนึ่งของยุโรปเขาไม่ได้คิดอย่างนั้น เขาเดินหน้าต่อ และท้ายสุดก็พายุโรปเข้าสู่ยุคตื่นรู้ทางปัญญา วิทยาศาสตร์เจริญ เทคโนโลยีใหม่เกิด ส่วนจักรวรรดิออตโตมานที่เคยยิ่งใหญ่ รุ่งเรือง ก็เริ่มถดถอยลงเรื่อยๆ และล่มสลายปิดจ๊อบเมื่อสิ้นสุดสงครามโลกครั้งที่หนึ่ง อจ Yann ยกเรื่องนี้มาเปรียบเทียบได้เจ็บแสบ พอๆกับต้นทวิตที่พูดเรื่องการประท้วงเครื่องจักรทอผ้า เทคโนโลยีล้ำยุคที่จะมาแทนแรงงานคน กลุ่มนี้เรียกว่ากลุ่ม “Luddites” ผมว่าศึกษาเรื่อง AI ถ้าเข้าใจเรื่องเทคโนโลยีแล้ว เรื่องที่ไปที่มา ประวัติศาสตร์ก็เป็นเรื่องที่ควรค่าแก่การศึกษาอย่างยิ่ง […]

Yann LeCun vs. Ilya Sutskever

พงษ์ระพี เตชพาหพงษ์ สองอินฟูเอนเซอร์ ที่ปะทะทางความคิดกันอยู่เสมอ และมักจะมองต่างกัน คนแรก Yann LeCun คนนี้พอจะบอกได้ว่าเป็นคนบุกเบิกเรื่อง Deep Learning คนแรกๆของวงการ แกมาจากสายวิจัยโดยตรง นับว่าเป็นรุ่นใหญ่ที่มีชื่อเสียง และตอนนี้มากินตำแหน่ง Chief AI Scientist ที่ Meta (Facebook) ส่วนอีกคน Ilya Sutskever มีตำแหน่งเดียวกัน แต่อยู่ที่ OpenAI เจ้าของ ChatGPT อันโด่งดัง Yann มักจะพูดออกสื่ออยู่เสมอว่า Language Model ที่เป็นอยู่นั้น มันไม่เข้าใจอะไรเลย มันแค่พ่นคำออกมาจากสูตรทางคณิตศาสตร์ จากแพทเทิร์นทางสถิติเท่านั้น ไม่มีคอมมอนเซนต์ ยังห่างไกลนักกับความเข้าใจอย่างที่มนุษย์เป็นนัก ถ้าจะมีอะไรที่สร้าง AI ให้ใกล้เคียงมนุษย์ มันคงไม่ใช่ LLM แต่ควรจะเป็นทฤษฏีใหม่อะไรสักอย่างไปเลย แกไม่พูดเรื่องนี้ลอยๆ เดินสายเลคเชอร์ตามยูต่างๆ พร้อมกับสไลด์อธิบายหลายสิบสไลด์ ส่วน Ilya นั้น ก็ให้ความเห็นที่น่าสนใจ แต่จะตอบแบบนุ่มนวลกว่า และไม่ได้ไปดีเบตชนตรงกับ […]

OpenAI ในวันที่กลืนน้ำลายตัวเอง

พงษ์ระพี เตชพาหพงษ์ พูดถึง ChatGPT เราก็จะนึกถึง Sam Altman ที่เป็น CEO แต่จริงๆแล้วมีตัวละครอีกตัวที่สำคัญมาก คนนั้นก็คือ Ilya Sutskever แกเกิดรัสเซีย ไปโตที่แคนาดาแล้วย้ายมาทำงานที่อเมริกา คนนี้คือ “มือขวา” แซม กินตำแหน่ง Chief Scientist พูดง่ายๆก็คือ คนที่สร้าง ChatGPT ขึ้นมานั่นเอง Ilya เพิ่งให้สัมภาษณ์ The Verge ประเด็นเรื่อง Open Source ของ ChatGPT ที่มันเป็นประเด็นเพราะแรกเริ่มเดิมทีนั้นตัว Sam Altman ประกาศตั้งแต่โปรเจกต์เริ่มต้นว่า AI ที่จะสร้างขึ้นมานี้ก็เพื่อมวลมนุษยชาติ ไม่ได้ต้องการสร้างเพื่อนายทุนคนใดคนหนึ่ง ดังนั้นองค์กรก็เลยเป็นแบบ non-profit และโค้ดที่สร้างขึ้นมาก็จะเป็น Open Source เจตจำนงดูยิ่งใหญ่และติส์มาก สำหรับชื่อบริษัทก็เลยใช้ชื่อว่า OpenAI ซึ่งตรงนี้ Elon Musk เคลมว่าเขาเองเป็นคนตั้งชื่อให้ และเป็นนายทุนคนแรกที่ลงเงินไปในโปรเจกต์นี้ แต่หลังจากทำมาหลายปี […]

แกะรอย ChatGPT Plugin ตอน 1

พงษ์ระพี เตชพาหพงษ์ ช่วงนี้ OpenAI อัปเกรดและปล่อยคุณสมบัติเด็ดๆของ ChatGPT ออกมารัวๆ แค่เปิดตัว ChatGPT 4 คนก็ฮือฮามากแล้ว หลังจากนั้นไม่นานก็ปล่อยคุณสมบัติใหม่ที่เรียกว่า Plugin อีก youtuber หลายคนบอกว่ามันเป็น App Store for ChatGPT บางคนบอกว่ามันเป็นแพลทฟอร์ม และเลยไปถึงมันเป็น game changer เลยทีเดียว Plugin ที่ OpenAI ปล่อยออกมานั้นมีทั้งหมด 4 ตัวด้วยกัน เด็ดๆทั้งนั้น ตอนนี้มาดูตัวแรกก่อน นั่นก็คือ Browsing เรารู้กันอยู่ว่า ChatGPT นั้นข้อมูลล่าสุดที่ถูกเทรนในระบบคือ ตุลาคม 2021 ประเด็นคือ ถ้าถามข้อมูลที่ใหม่กว่านั้น มันก็ตอบไม่ได้ Browsing Plugin นี่แหละเป็นคำตอบ เพราะแทนที่ระบบจะไปเทรนข้อมูลอัปเดทไปเรื่อยๆ กลับใช้วิธีการให้ ChatGPT ไปบราวซ์ค้นหาข้อมูลในเว็บที่เกี่ยวข้องแทน ซึ่งรวมถึงข้อมูลแบบเรียลไทม์ด้วย เรียกว่า Browsing Plugin เป็นแนวคิดในการแก้ปัญหาข้อมูลไม่อัปเดทแบบเนียนๆ […]

แกะรอย GPT ตอน 5

พงษ์ระพี เตชพาหพงษ์ แกะรอย GPT ตอน 5 สามสี่ตอนที่ผ่านมา เราเล่ากันถึงความหมายที่ซ่อนอยู่ระหว่างตัวอักษรของ ChatGPT ไปละ ตอนนี้เรามาเดินทางกันต่อ ถ้าลองไปถามหลายๆคนว่า ChatGPT คืออะไร? ผมเชื่อว่าคำตอบออกมาคงจะหลากหลาย อาจจะเริ่มตั้งแต่ มันคือเครื่องมือมหัศจรรย์ กูรูผู้รู้ทุกอย่าง เอไอที่จะเปลี่ยนแปลงโลก ไปจนถึงความหมายลึกๆอย่าง Large Language Model หรือ Machine Learning สำหรับผมแล้วเวลาเล่าเรื่องนี้ให้คนอื่นฟัง ผมมักจะหยิบยกเอานิยามที่แตกต่างกันไปไปเล่าให้เหมาะสมกับคนฟัง แต่ถ้าเขามีความสนใจและมีเวลามากหน่อย ผมจะเล่าเริ่มจากประโยคภาษาอังกฤษง่ายๆว่า ChatGPT=predicting the probability distribution of training data แล้วค่อยๆถอดรหัสทีละคำว่ามันหมายถึงอะไร และถ้าสีหน้าแววตาของผู้ฟังดูลุกวาว ผมก็จะค่อยๆดำดิ่งลงลึกในรายละเอียดไปจนถึงสูตร Math ที่รองรับ ว่ามันประกอบร่างและทำงานกันอย่างไร ซึ่งตรงนี้น่าสนใจ ถ้าพื้นฐานเรา “เข้าใจได้แน่นเพียงพอ” เราจะเข้าใจศักยภาพและข้อจำกัดของมันจากประโยคเดียวที่อธิบายไป และถ้าคนฟังมีพื้น Math มาพอสมควร เขาก็สามารถต่อยอดจินตนาการออกไปได้อีก อาจจะไปจนถึงการสร้างสรรค์อะไรใหม่ๆออกมาก็เป็นได้ และนี่คงเป็นสิ่งที่บิลเกตส์เห็นและได้เขียนถึงความสำคัญของ Math ถึงกับเคลมประเด็นว่าช่วย […]

แกะรอย GPT ตอน 4

พงษ์ระพี เตชพาหพงษ์ บทความก่อนหน้านี้ผมได้แกะความหมายและความเกี่ยวโยงของ GPT ไปแล้วสองตัว และมาถึงตัวสุดท้ายคือ T (Transformer) ถ้าคุณเอาคำนี้ไปค้น สิ่งแรกที่จะเห็นก็คือ “หม้อแปลงไฟฟ้า” ถัดมาน่าจะเป็น “หุ่นยนต์” ในหนังเรื่อง Transformer แต่จริงๆแล้ว Transformer ในที่นี้คือชื่อสถาปัตยกรรมตัวใหม่ที่อยู่ในเปเปอร์ Attention is all you need และจะสื่อถึง “การเปลี่ยนผ่านจากจุดหนึ่งไปอีกจุดหนึ่ง” (transforms an input sequence into an output sequence) โดยใช้แมกคานิซึมตัวใหม่ที่เรียกว่า “Self-Attention” … ซึ่งเรื่องนี้มีความลึก ไว้มีโอกาสจะมาเล่าให้อ่านกันอีกทีนะครับ หลายคนบอกว่าจริงๆชื่อ Transformer นี่ คนเขียนเปเปอร์ก็เอามาจากหนังนี่แหละ แบบจะได้ดูเท่ห์และสื่อความกับเรื่องที่ทำด้วย ว่าไปแล้วก็ฟังขึ้นเหมือนกันนะ และบางคนก็บอกต่อไปอีกว่า มันลึกไปกว่านั้นอีก เพราะคำว่า “Trans” นั้น ในอเมริกา หมายถึงอีกกลุ่มหนึ่ง ที่คนในแวดวงเทคเอง ก็มีอยู่เยอะ เอาเป็นว่าอยากจะเชื่อแบบไหนก็ตามสะดวกเลยนะครับ ถ้าคุณชอบบทความสั้นๆ […]

แกะรอย GPT ตอน 3

พงษ์ระพี เตชพาหพงษ์ ตอนที่แล้วผมแกะรอยเล่าถึง ความหมายของ G ตัวแรกในคำย่อ GPT ไปแล้ว ทีนี้มาดูตัวที่สองกันนั่นก็คือ P ซึ่งเป็นอักษรย่อจากคำว่า Pre-trained ตรงนี้แหละน่าสนใจ เรามาแยกเป็น subword ก่อนนะ เริ่มที่คำ trained ใครอย่าไปนึกว่ามันคือ “รถไฟ” เชียวนะ ไม่ใช่ๆ มันก็คือ “การเทรน” ที่เป็นคำทับศัพท์ในภาษาไทยนั่นแหละ และในรูปต่อด้วย “ed” ก็แปลว่า “มันถูกเทรนมาเรียบร้อยแล้ว” คำถามถัดมา แล้วการเทรนคืออะไร โอว ตรงนี้ถ้าเล่าละเอียด ก็คงยาวมาก เอาเป็นว่า ระบบจะเอาข้อมูลข้อความที่ไปกวาดมาทั้งหนังสือ ในเน็ตนับพันล้านคำมาแปลงเป็นตัวเลขในหน้าตาของเมตริกซ์ (ตรงนี้ต้องใช้ความรู้คณิตศาสตร์ที่เรียกว่า Algebra ช่วย ใครเรียนมอปลายสายวิทย์ก็อาจจะคุ้นเคยดีนะ แต่จะลืมไปแล้วหรือเปล่าก็มาว่ากันอีกที) จากนั้นก็ถูกนำไปประมวลผลตามสถาปัตยกรรมหลายซับหลายซ้อน จนได้เมตริกซ์ที่ตกผลึกมาเก็บไว้ ตรงนี้แหละคือ “การเทรนดาต้าเซต” เรื่องที่มหัศจรรย์เกินจินตนาการก็คือ ไอ้ตัวเลขเหล่านี้ มันทำให้ระบบเข้าใจภาษา เข้าใจความหมาย ความต้องการของผู้ใช้ และสามารถไปดึงคำตอบจากสิ่งที่เทรนมาได้ คิดแล้วมันน่าอัศจรรย์ใจจริงๆ เอาไว้มีโอกาสจะมาเล่าเชิงเทคนิคพวกนี้ให้ฟังอีกทีนะครับ และเมื่อได้ข้อมูลที่ผ่านการเทรนมาแล้ว […]

1 2 3