แกะรอย GPT ตอน 3
พงษ์ระพี เตชพาหพงษ์ ตอนที่แล้วผมแกะรอยเล่าถึง ความหมายของ G ตัวแรกในคำย่อ GPT ไปแล้ว ทีนี้มาดูตัวที่สองกันนั่นก็คือ P ซึ่งเป็นอักษรย่อจากคำว่า Pre-trained ตรงนี้แหละน่าสนใจ เรามาแยกเป็น subword ก่อนนะ เริ่มที่คำ trained ใครอย่าไปนึกว่ามันคือ “รถไฟ” เชียวนะ ไม่ใช่ๆ มันก็คือ “การเทรน” ที่เป็นคำทับศัพท์ในภาษาไทยนั่นแหละ และในรูปต่อด้วย “ed” ก็แปลว่า “มันถูกเทรนมาเรียบร้อยแล้ว” คำถามถัดมา แล้วการเทรนคืออะไร โอว ตรงนี้ถ้าเล่าละเอียด ก็คงยาวมาก เอาเป็นว่า ระบบจะเอาข้อมูลข้อความที่ไปกวาดมาทั้งหนังสือ ในเน็ตนับพันล้านคำมาแปลงเป็นตัวเลขในหน้าตาของเมตริกซ์ (ตรงนี้ต้องใช้ความรู้คณิตศาสตร์ที่เรียกว่า Algebra ช่วย ใครเรียนมอปลายสายวิทย์ก็อาจจะคุ้นเคยดีนะ แต่จะลืมไปแล้วหรือเปล่าก็มาว่ากันอีกที) จากนั้นก็ถูกนำไปประมวลผลตามสถาปัตยกรรมหลายซับหลายซ้อน จนได้เมตริกซ์ที่ตกผลึกมาเก็บไว้ ตรงนี้แหละคือ “การเทรนดาต้าเซต” เรื่องที่มหัศจรรย์เกินจินตนาการก็คือ ไอ้ตัวเลขเหล่านี้ มันทำให้ระบบเข้าใจภาษา เข้าใจความหมาย ความต้องการของผู้ใช้ และสามารถไปดึงคำตอบจากสิ่งที่เทรนมาได้ คิดแล้วมันน่าอัศจรรย์ใจจริงๆ เอาไว้มีโอกาสจะมาเล่าเชิงเทคนิคพวกนี้ให้ฟังอีกทีนะครับ และเมื่อได้ข้อมูลที่ผ่านการเทรนมาแล้ว […]