Google hit with lawsuit alleging it stole data from millions of users to train its AI tools

ซีเอ็นเอ็น – เมื่อวันอังคารที่ผ่านมา Google ถูกฟ้องร้องอย่างกว้างขวางโดยกล่าวหาว่ายักษ์ใหญ่ด้านเทคโนโลยีคัดลอกข้อมูลจากผู้ใช้หลายล้านคนโดยไม่ได้รับความยินยอมและละเมิดกฎหมายลิขสิทธิ์เพื่อฝึกอบรมและพัฒนาผลิตภัณฑ์ปัญญาประดิษฐ์

CNN – Google was hit with a wide-ranging lawsuit on Tuesday alleging the tech giant scraped data from millions of users without their consent and violated copyright laws in order to train and develop its artificial intelligence products.

Google ถูกฟ้องร้องโดยกล่าวหาว่าขโมยข้อมูลจากผู้ใช้หลายล้านคนเพื่อฝึกอบรมเครื่องมือ AI

ซีเอ็นเอ็น – เมื่อวันอังคารที่ผ่านมา Google ถูกฟ้องร้องอย่างกว้างขวางโดยกล่าวหาว่ายักษ์ใหญ่ด้านเทคโนโลยีคัดลอกข้อมูลจากผู้ใช้หลายล้านคนโดยไม่ได้รับความยินยอมและละเมิดกฎหมายลิขสิทธิ์เพื่อฝึกอบรมและพัฒนาผลิตภัณฑ์ปัญญาประดิษฐ์

การฟ้องร้องดำเนินคดีแบบกลุ่มที่เสนอต่อ Google, Alphabet บริษัทแม่ และ DeepMind บริษัทในเครือ AI ของ Google ถูกยื่นฟ้องต่อศาลรัฐบาลกลางในแคลิฟอร์เนียเมื่อวันอังคาร และดำเนินการโดยสำนักงานกฎหมาย Clarkson ก่อนหน้านี้บริษัทได้ยื่นฟ้องในลักษณะเดียวกันนี้กับ OpenAI ผู้ผลิต ChatGPT เมื่อเดือนที่แล้ว

การร้องเรียนอ้างว่า Google “แอบขโมยทุกอย่างที่เคยสร้างและแบ่งปันบนอินเทอร์เน็ตโดยชาวอเมริกันหลายร้อยล้านคน” และใช้ข้อมูลนี้เพื่อฝึกอบรมผลิตภัณฑ์ AI เช่น แชทบอท Bard การร้องเรียนยังอ้างว่า Google ได้นำ “digital footprint ของเราเกือบทั้งหมด” รวมถึง “งานสร้างสรรค์และ Copywriting งานเขียนคำด้านโฆษณาและการตลาด ซึ่งเนื้อหาของบทความจะเน้นไปที่การโน้มน้าวผู้อ่าน ให้กระทำบางอย่างตามที่ผู้เขียนต้องการ เพื่อนำไปสร้างผลิตภัณฑ์ AI

Halimah DeLaine Prado ที่ปรึกษาทั่วไปของ Google เรียกการอ้างสิทธิ์ในคดีนี้ว่า “ไม่มีมูลความจริง” ในแถลงการณ์ต่อ CNN “เราชัดเจนมาหลายปีแล้วว่า เราใช้ข้อมูลจากแหล่งข้อมูลสาธารณะ เช่น ข้อมูลที่เผยแพร่บนเว็บเปิด และชุดข้อมูลสาธารณะ เพื่อฝึกโมเดล AI ที่อยู่เบื้องหลังบริการต่างๆ เช่น Google Translate อย่างมีความรับผิดชอบและสอดคล้องกับหลักการ AI ของเรา” DeLaine Prado กล่าว

“กฎหมายอเมริกันสนับสนุนการใช้ข้อมูลสาธารณะเพื่อสร้างประโยชน์ใหม่ๆ และเราหวังว่าจะหักล้างคำกล่าวอ้างที่ไม่มีมูลความจริงเหล่านี้” แถลงการณ์ระบุเพิ่มเติม

การร้องเรียนชี้ไปที่การปรับปรุงล่าสุดของนโยบายส่วนบุคคลของ Google ที่ระบุอย่างชัดเจนว่าบริษัทอาจใช้ข้อมูลที่สาธารณะสามารถเข้าถึงได้เพื่อฝึกโมเดลและเครื่องมือ AI เช่น Bard

บริษัทกล่าวว่านโยบายของบริษัท “มีความโปร่งใสมานานแล้ว” เกี่ยวกับแนวทางปฏิบัตินี้ และ “การอัปเดตล่าสุดนี้ชี้แจงว่าบริการใหม่ๆ เช่น Bard รวมอยู่ด้วย”

คดีดังกล่าวเกิดขึ้นเนื่องจากเครื่องมือ AI แบบใหม่ได้รับความสนใจอย่างมากในช่วงหลายเดือนที่ผ่านมา เนื่องจากความสามารถในการสร้างงานเขียนและรูปภาพเพื่อตอบสนองต่อข้อความแจ้งของผู้ใช้ โมเดลภาษาขนาดใหญ่ที่สนับสนุนเทคโนโลยีใหม่นี้สามารถทำได้โดยการฝึกอบรมเกี่ยวกับข้อมูลออนไลน์จำนวนมหาศาล

อย่างไรก็ตาม ในกระบวนการนี้ บริษัทต่าง ๆ กำลังตรวจสอบข้อเท็จจริงทางกฎหมายเพิ่มเติมเกี่ยวกับปัญหาลิขสิทธิ์จากผลงานที่อยู่ในชุดข้อมูลเหล่านี้ รวมถึงการใช้ข้อมูลส่วนตัวและข้อมูลที่ละเอียดอ่อนจากผู้ใช้ทั่วไป รวมถึงข้อมูลจากเด็กด้วย คดีความ

“Google จำเป็นต้องเข้าใจว่า ‘เปิดเผยต่อสาธารณะ’ ไม่ได้หมายถึงการใช้งานฟรีเพื่อวัตถุประสงค์ใดๆ ทั้งสิ้น” Tim Giordano หนึ่งในทนายความของ Clarkson ที่ยื่นฟ้อง Google กล่าวกับ CNN ในการให้สัมภาษณ์ “ข้อมูลส่วนตัวของเราและข้อมูลของเราเป็นทรัพย์สินของเรา และมันมีค่า ไม่มีใครมีสิทธิ์แค่จะเอาไปใช้เพื่อวัตถุประสงค์ใดๆ”

คดีนี้กำลังมองหาคำสั่งศาลในรูปแบบของการระงับชั่วคราวในการเข้าถึงเชิงพาณิชย์และการพัฒนาเชิงพาณิชย์ของเครื่องมือสร้าง AI ของ Google เช่น Bard นอกจากนี้ยังแสวงหาความเสียหายและการชำระเงินที่ไม่ระบุรายละเอียดเป็นการชดเชยทางการเงินแก่ผู้ที่ถูกกล่าวหาว่าใช้ข้อมูลโดย Google บริษัท ระบุว่าได้เรียงร้อยโจทก์แปดคนรวมถึงผู้เยาว์

Giordano เปรียบเทียบข้อดีและข้อเสียของการที่ Google จัดทำดัชนีข้อมูลออนไลน์เพื่อสนับสนุนเครื่องมือค้นหาหลักของตนกับข้อกล่าวหาใหม่เกี่ยวกับการขูดข้อมูลเพื่อฝึกเครื่องมือ AI

ด้วยเสิร์ชเอ็นจิ้น เขากล่าวว่า Google สามารถ “แสดงลิงก์ที่ระบุถึงงานของคุณซึ่งสามารถกระตุ้นให้คนซื้อหรือมีส่วนร่วมกับมันได้” อย่างไรก็ตาม การขูดข้อมูลเพื่อฝึกเครื่องมือ AI กำลังสร้าง “เวอร์ชันทางเลือกของงานที่เปลี่ยนแรงจูงใจอย่างมากสำหรับใครก็ตามที่ต้องการซื้อผลงาน” Giordano กล่าวเสริม

แม้ว่าผู้ใช้อินเทอร์เน็ตบางรายอาจคุ้นเคยกับการเก็บรวบรวมและใช้งานข้อมูลดิจิทัลของตนสำหรับผลการค้นหาหรือโฆษณาที่ตรงเป้าหมายมากขึ้น แต่การฝึกอบรม AI ก็อาจไม่ใช่เรื่องเดียวกัน “ผู้คนนึกไม่ถึงว่าข้อมูลของพวกเขาจะถูกนำไปใช้ในลักษณะนี้” Giordano กล่าว

Ryan Clarkson หุ้นส่วนของสำนักงานกฎหมายกล่าวว่า Google จำเป็นต้อง “สร้างโอกาสให้ผู้คนเลือกไม่ใช้” ไม่ให้มีการใช้ข้อมูลของพวกเขาในการฝึกอบรม AI ในขณะที่ยังคงรักษาความสามารถในการใช้อินเทอร์เน็ตสำหรับความต้องการในชีวิตประจำวันของพวกเขา

view original *