ผู้ช่วยเสียงเช่น Siri, Alexa และ Google Assistant แพ้การแข่งขัน AI กับแชทบอท ตามรายงานล่าสุด แม้จะเปิดตัวในปี 2554 แต่การพัฒนาผู้ช่วยเสมือนส่วนใหญ่ยังคงซบเซา และถูกกีดขวางจากอุปสรรคทางเทคโนโลยีและการคำนวณผิดพลาดในการตัดสินใจลงทุน ในทางตรงกันข้าม แชทบอทที่ขับเคลื่อนโดยโมเดลภาษาขนาดใหญ่ได้รับความนิยมเพิ่มขึ้นเนื่องจากสามารถจัดการงานที่ซับซ้อน เช่น ซอฟต์แวร์เขียนโค้ดและการเขียนนิยายได้ อย่างไรก็ตาม Siri, Alexa และ Google Assistant ซึ่งอาศัยระบบสั่งการและควบคุม สามารถเข้าใจเฉพาะรายการคำถามและคำขอที่จำกัด และไม่สามารถด้นสดได้
Voice assistants like Siri, Alexa, and Google Assistant have lost the AI race to chatbots, according to a recent report. Despite debuting in 2011, the development of virtual assistants has largely remained stagnant, and they have been hampered by technological hurdles and miscalculations in investment decisions. In contrast, chatbots, powered by large language models, have grown in popularity as they can handle complex tasks like coding software and writing fiction. However, Siri, Alexa, and Google Assistant, which rely on command-and-control systems, can only understand a finite list of questions and requests, and cannot improvise.
Siri, Alexa และ Google Assistant แพ้ในการแข่ง A.I.
ในวันอังคารที่ฝนตกในซานฟรานซิสโก ผู้บริหารของ Apple ขึ้นเวทีในหอประชุมที่มีผู้คนหนาแน่นเพื่อเปิดตัว iPhone รุ่นที่ 5 โทรศัพท์ซึ่งดูเหมือนกับรุ่นก่อนหน้ามีคุณสมบัติใหม่ที่ผู้ฟังพูดถึงในไม่ช้า: Siri ผู้ช่วยเสมือน
Scott Forstall ซึ่งขณะนั้นเป็นหัวหน้าฝ่ายซอฟต์แวร์ของ Apple กดปุ่ม iPhone เพื่อเรียก Siri และถามคำถาม ตามคำขอของเขา Siri ตรวจสอบเวลาในปารีส (“20:16 น.” Siri ตอบ) ให้คำจำกัดความของคำว่า “mitosis” (“การแบ่งเซลล์ที่นิวเคลียสแบ่งเป็นนิวเคลียสที่มีจำนวนโครโมโซมเท่ากัน” กล่าว) และดึงรายชื่อร้านอาหารกรีกที่ได้รับคะแนนสูง 14 ร้าน โดย 5 ร้านอยู่ในพาโลอัลโต รัฐแคลิฟอร์เนีย “ฉันเคยอยู่ใน A.I. เป็นเวลานานและสิ่งนี้ก็ยังทำให้ฉันทึ่ง” นายฟอร์สตอลกล่าว นั่นคือเมื่อ 12 ปีที่แล้ว ตั้งแต่นั้นเป็นต้นมา ผู้คนต่างรู้สึกประทับใจกับ Siri และผู้ช่วยคู่แข่งที่ขับเคลื่อนโดยปัญญาประดิษฐ์ เช่น Alexa และ Google Assistant ของ Amazon เทคโนโลยีส่วนใหญ่ยังคงหยุดนิ่ง และผู้ช่วยพูดคุยได้กลายเป็นเรื่องตลก รวมถึงภาพร่าง “Saturday Night Live” ในปี 2018 ที่มีลำโพงอัจฉริยะสำหรับผู้สูงอายุ
โลกเทคโนโลยีกำลังหลั่งไหลเข้ามาแทนที่ผู้ช่วยเสมือนประเภทต่างๆ: แชทบอท บอทที่ขับเคลื่อนด้วย A.I. เหล่านี้ เช่น ChatGPT และ ChatGPT Plus ใหม่จากบริษัท OpenAI ในซานฟรานซิสโก สามารถแสดงคำตอบสำหรับคำถามที่พิมพ์ลงในกล่องแชทด้วยความกระตือรือร้น ผู้คนใช้ ChatGPT เพื่อจัดการงานที่ซับซ้อน เช่น ซอฟต์แวร์เขียนโค้ด ร่างข้อเสนอทางธุรกิจ และเขียนนิยาย และ ChatGPT ซึ่งใช้ A.I. เพื่อเดาว่าคำอะไรจะเกิดขึ้นต่อไป มีการพัฒนาอย่างรวดเร็ว ไม่กี่เดือนที่ผ่านมา มันไม่สามารถเขียนไฮกุที่เหมาะสมได้ ตอนนี้มันสามารถทำได้ด้วยความเอร็ดอร่อย เมื่อวันอังคาร OpenAI ได้เปิดตัว A.I. รุ่นต่อไป เครื่องยนต์ GPT-4 ซึ่งขับเคลื่อน ChatGPT ความตื่นเต้นเกี่ยวกับแชทบอทแสดงให้เห็นว่า Siri, Alexa และผู้ช่วยด้านเสียงอื่นๆ ซึ่งครั้งหนึ่งเคยกระตุ้นความกระตือรือร้นแบบเดียวกันนี้ ได้สูญเสียความเป็นผู้นำในการแข่ง A.I.
ในช่วงทศวรรษที่ผ่านมา ผลิตภัณฑ์ต่างๆ จอห์น เบอร์คีย์ อดีตวิศวกรของแอปเปิลที่ทำงานเกี่ยวกับผู้ช่วยกล่าวว่า Siri พบกับอุปสรรคทางเทคโนโลยี ซึ่งรวมถึงโค้ดที่เทอะทะซึ่งใช้เวลาหลายสัปดาห์ในการอัปเดตฟีเจอร์พื้นฐาน Amazon และ Google คำนวณผิดว่าจะใช้ผู้ช่วยเสียงอย่างไร ทำให้พวกเขาลงทุนในด้านต่างๆ ด้วยเทคโนโลยีที่ไม่ค่อยได้ผลตอบแทน อดีตพนักงานกล่าว เมื่อการทดลองเหล่านั้นล้มเหลว ความกระตือรือร้นในเทคโนโลยีก็ลดลงตามบริษัทต่างๆ พวกเขากล่าว
ผู้ช่วยเสียงนั้น “โง่เหมือนหิน” Satya Nadella ประธานเจ้าหน้าที่บริหารของ Microsoft กล่าวในการให้สัมภาษณ์ในเดือนนี้กับ The Financial Times โดยประกาศว่า A.I. รุ่นใหม่ จะเป็นผู้นำทาง Microsoft ได้ทำงานอย่างใกล้ชิดกับ OpenAI โดยลงทุน 13,000 ล้านดอลลาร์ในการเริ่มต้นและรวมเทคโนโลยีเข้ากับเครื่องมือค้นหา Bing รวมถึงผลิตภัณฑ์อื่นๆ
Apple ปฏิเสธที่จะแสดงความคิดเห็นเกี่ยวกับ Siri Google กล่าวว่ามีความมุ่งมั่นที่จะจัดหาผู้ช่วยเสมือนที่ยอดเยี่ยมเพื่อช่วยเหลือผู้คนทางโทรศัพท์ ในบ้านและในรถยนต์ บริษัท กำลังทดสอบแชทบอทที่เรียกว่า Bard แยกต่างหาก อเมซอนกล่าวว่าเห็นการมีส่วนร่วมของลูกค้าทั่วโลกกับ Alexa เพิ่มขึ้น 30 เปอร์เซ็นต์ในปีที่แล้ว และมองในแง่ดีเกี่ยวกับพันธกิจในการสร้าง A.I. ระดับโลก
ผู้ช่วยและแชทบอทนั้นขึ้นอยู่กับรสชาติของ A.I. แชทบอทขับเคลื่อนโดยสิ่งที่เรียกว่าโมเดลภาษาขนาดใหญ่ ซึ่งเป็นระบบที่ได้รับการฝึกฝนให้จดจำและสร้างข้อความตามชุดข้อมูลจำนวนมหาศาลที่คัดลอกมาจากเว็บ จากนั้นพวกเขาสามารถแนะนำคำเพื่อทำให้ประโยคสมบูรณ์ได้
ในทางตรงกันข้าม Siri, Alexa และ Google Assistant โดยพื้นฐานแล้วเป็นสิ่งที่เรียกว่าระบบสั่งการและควบคุม สิ่งเหล่านี้สามารถเข้าใจรายการคำถามและคำขอที่จำกัด เช่น “สภาพอากาศในนิวยอร์กซิตี้เป็นอย่างไร” หรือ “เปิดไฟห้องนอน” หากผู้ใช้ขอให้ผู้ช่วยเสมือนทำบางสิ่งที่ไม่ได้อยู่ในโค้ด บอทก็จะบอกว่าช่วยไม่ได้
Siri ยังมีการออกแบบที่ยุ่งยากซึ่งทำให้ใช้เวลานานในการเพิ่มคุณสมบัติใหม่ๆ นาย Burkey ผู้ซึ่งได้รับงานปรับปรุง Siri ในปี 2014 กล่าว ฐานข้อมูลของ Siri มีรายการคำจำนวนมหาศาล รวมถึงชื่อศิลปินดนตรีและสถานที่ อย่างร้านอาหาร ในภาษาต่างๆ เกือบสองโหล นั่นทำให้มันกลายเป็น “ก้อนหิมะก้อนใหญ่” เขากล่าว หากมีคนต้องการเพิ่มคำลงในฐานข้อมูลของ Siri เขากล่าวเสริมว่า “มันรวมเป็นกองใหญ่”
ดังนั้นการอัปเดตที่ดูเหมือนง่าย เช่น การเพิ่มวลีใหม่ลงในชุดข้อมูล จะต้องสร้างฐานข้อมูลใหม่ทั้งหมด ซึ่งอาจใช้เวลาถึงหกสัปดาห์ นาย Burkey กล่าว การเพิ่มคุณสมบัติที่ซับซ้อนมากขึ้น เช่น เครื่องมือค้นหาใหม่อาจใช้เวลาเกือบหนึ่งปี นั่นหมายความว่าไม่มีทางที่ Siri จะกลายเป็นผู้ช่วยสร้างสรรค์เช่น ChatGPT เขากล่าว
Alexa และ Google Assistant ใช้เทคโนโลยีที่คล้ายกับ Siri แต่บริษัทต่าง ๆ ประสบปัญหาในการสร้างรายได้ที่มีความหมายด้วยผู้ช่วย อดีตผู้จัดการของ Amazon และ Google กล่าว (ในทางตรงกันข้าม Apple ประสบความสำเร็จในการใช้ Siri เพื่อดึงดูดผู้ซื้อไปยัง iPhone)
หลังจากที่ Amazon เปิดตัว Echo ซึ่งเป็นลำโพงอัจฉริยะที่ขับเคลื่อนโดย Alexa ในปี 2014 บริษัทหวังว่าผลิตภัณฑ์ดังกล่าวจะช่วยเพิ่มยอดขายในร้านค้าออนไลน์ด้วยการทำให้ผู้บริโภคสามารถพูดคุยกับ Alexa เพื่อสั่งซื้อได้ อดีตผู้นำของ Amazon ที่เกี่ยวข้องกับ Alexa กล่าว แต่ในขณะที่ผู้คนสนุกสนานกับความสามารถของ Alexa ในการตอบรับสภาพอากาศและตั้งปลุก แต่มีเพียงไม่กี่คนที่ขอให้ Alexa สั่งซื้อสินค้า เขากล่าวเสริม อเมซอนอาจลงทุนมากเกินไปในการสร้างฮาร์ดแวร์ชนิดใหม่ เช่น นาฬิกาปลุกและไมโครเวฟที่เลิกผลิตแล้วซึ่งทำงานร่วมกับ Alexa ซึ่งขายได้ในราคาหรือต่ำกว่าราคา ผู้บริหารคนเดิมกล่าว
บริษัทยังลงทุนน้อยในการสร้างระบบนิเวศเพื่อให้ผู้คนสามารถขยายความสามารถของ Alexa ได้อย่างง่ายดาย ในแบบเดียวกับที่ Apple ทำกับ App Store ซึ่งช่วยกระตุ้นความสนใจใน iPhone บุคคลดังกล่าว แม้ว่า Amazon จะเสนอร้าน “ทักษะ” เพื่อทำให้ Alexa ควบคุมอุปกรณ์เสริมของบุคคลที่สาม เช่น สวิตช์ไฟ แต่ก็เป็นเรื่องยากสำหรับผู้คนที่จะค้นหาและตั้งค่าทักษะสำหรับผู้พูด ซึ่งแตกต่างจากประสบการณ์การดาวน์โหลดแอปบนอุปกรณ์เคลื่อนที่จากร้านแอป
Carolina Milanesi นักวิเคราะห์เทคโนโลยีผู้บริโภคของบริษัทวิจัย Creative Strategies ซึ่งเป็นที่ปรึกษาของ Amazon กล่าวว่า “เราไม่เคยมีช่วงเวลานั้นสำหรับผู้ช่วยของ App Store เลย” เมื่อปลายปีที่แล้ว แผนก Amazon ที่ทำงานกับ Alexa ตกเป็นเป้าหมายหลักในการปลดพนักงาน 18,000 คนของบริษัท และผู้บริหารระดับสูงของ Alexa จำนวนหนึ่งลาออกจากบริษัทแล้ว Kinley Pearsall โฆษกหญิงของ Amazon กล่าวว่า Alexa เป็นมากกว่าผู้ช่วยสั่งงานด้วยเสียง และ “เรายังคงมองโลกในแง่ดีเกี่ยวกับภารกิจดังกล่าวเช่นเคย”
ความผิดพลาดของ Amazon กับ Alexa อาจทำให้ Google หลงผิด อดีตผู้จัดการที่ทำงานเกี่ยวกับ Google Assistant กล่าว วิศวกรของ Google ใช้เวลาหลายปีในการทดลองกับผู้ช่วยเพื่อเลียนแบบสิ่งที่ Alexa ทำได้ รวมถึงการออกแบบลำโพงอัจฉริยะและหน้าจอแท็บเล็ตที่ควบคุมด้วยเสียงเพื่อควบคุมอุปกรณ์เสริมภายในบ้าน เช่น เทอร์โมสตัทและสวิตช์ไฟ ต่อมาบริษัทได้รวมโฆษณาเข้ากับผลิตภัณฑ์สำหรับใช้ในบ้านเหล่านั้น ซึ่งไม่ได้เป็นแหล่งรายได้หลัก
เมื่อเวลาผ่านไป Google ตระหนักว่าคนส่วนใหญ่ใช้ผู้ช่วยเสียงเฉพาะกับงานง่ายๆ ในจำนวนที่จำกัด เช่น เริ่มจับเวลาและเล่นเพลง อดีตผู้จัดการกล่าว ในปี 2020 เมื่อ Prabhakar Raghavan ผู้บริหารของ Google เข้ารับตำแหน่ง Google Assistant กลุ่มของเขาได้โฟกัสไปที่สหายเสมือนในฐานะคุณสมบัติเด่นสำหรับสมาร์ทโฟน Android ในเดือนมกราคม เมื่อบริษัทแม่ของ Google เลิกจ้างพนักงาน 12,000 คน ทีมงานที่ทำงานเกี่ยวกับระบบปฏิบัติการสำหรับอุปกรณ์ภายในบ้านสูญเสียวิศวกรไป 16 เปอร์เซ็นต์
บริษัทเทคโนโลยีขนาดใหญ่หลายแห่งกำลังแข่งขันกันเพื่อตอบสนองต่อ ChatGPT ที่สำนักงานใหญ่ของ Apple เมื่อเดือนที่แล้ว บริษัทจัดงาน A.I. ประจำปี การประชุมสุดยอดซึ่งเป็นกิจกรรมภายในสำหรับพนักงานเพื่อเรียนรู้เกี่ยวกับรูปแบบภาษาขนาดใหญ่และ A.I. อื่นๆ เครื่องมือสองคนที่บรรยายสรุปเกี่ยวกับโปรแกรมกล่าวว่า วิศวกรหลายคนรวมถึงสมาชิกในทีม Siri ได้ทดสอบแนวคิดการสร้างภาษาทุกสัปดาห์ ผู้คนกล่าว ในวันอังคาร Google ยังกล่าวอีกว่าจะเปิดตัว generative A.I. เครื่องมือที่จะช่วยให้ธุรกิจ รัฐบาล และนักพัฒนาซอฟต์แวร์สร้างแอปพลิเคชันด้วยแชทบอทแบบฝังตัว และรวมเทคโนโลยีพื้นฐานเข้ากับระบบของพวกเขา
ในอนาคต เทคโนโลยีของแชทบอทและผู้ช่วยเสียงจะมาบรรจบกัน เอ.ไอ. ผู้เชี่ยวชาญกล่าวว่า ซึ่งหมายความว่าผู้คนจะสามารถควบคุมแชทบอทด้วยเสียงพูดได้ และผู้ที่ใช้ผลิตภัณฑ์ของ Apple, Amazon และ Google จะสามารถขอให้ผู้ช่วยเสมือนช่วยทำงานของพวกเขาได้ ไม่ใช่แค่งานอย่างการตรวจสอบสภาพอากาศเท่านั้น Aravind Srinivas ผู้ก่อตั้ง Perplexity ซึ่งเป็น A.I. กล่าวว่า “ผลิตภัณฑ์เหล่านี้ไม่เคยได้ผลมาก่อน เพราะเราไม่เคยมีความสามารถในการสนทนาระดับมนุษย์ สตาร์ทอัพที่ให้บริการเสิร์ชเอ็นจิ้นที่ขับเคลื่อนด้วยแชทบอท “ตอนนี้เราทำแล้ว”