The New York Times prohibits using its content to train AI models

สื่อสิ่งพิมพ์ได้อัปเดต T&Cs เพื่อรวมกฎที่ห้ามไม่ให้ใช้เนื้อหาในการฝึกระบบปัญญาประดิษฐ์

The publication has updated its T&Cs to include rules that forbid its content from being used to train artificial intelligence systems.

The New York Times ห้ามใช้เนื้อหาในการฝึกโมเดล AI

The New York Times ได้ใช้มาตรการป้องกันเพื่อหยุดการใช้เนื้อหาในการฝึกอบรมโมเดลปัญญาประดิษฐ์ ตามที่รายงานโดย Adweek NYT ได้ปรับปรุงข้อกำหนดในการให้บริการเมื่อวันที่ 3 สิงหาคมเพื่อห้ามไม่ให้นำเนื้อหาซึ่งรวมถึงข้อความ รูปถ่าย รูปภาพ คลิปเสียง/วิดีโอ “รูปลักษณ์และความรู้สึก” ข้อมูลเมตา หรือการรวบรวม มาใช้ในการพัฒนา ของ “โปรแกรมซอฟต์แวร์ใดๆ รวมถึงแต่ไม่จำกัดเพียงการฝึกอบรมการเรียนรู้ของเครื่องหรือระบบปัญญาประดิษฐ์ (AI)”

ข้อกำหนดที่อัปเดตตอนนี้ยังระบุด้วยว่าเครื่องมืออัตโนมัติ เช่น โปรแกรมรวบรวมข้อมูลเว็บไซต์ที่ออกแบบมาเพื่อใช้ เข้าถึง หรือรวบรวมเนื้อหาดังกล่าวไม่สามารถใช้งานได้โดยไม่ได้รับอนุญาตเป็นลายลักษณ์อักษรจากสิ่งพิมพ์ NYT กล่าวว่าการปฏิเสธที่จะปฏิบัติตามข้อจำกัดใหม่เหล่านี้อาจส่งผลให้เกิดค่าปรับหรือบทลงโทษที่ไม่ได้ระบุ แม้จะแนะนำกฎใหม่ให้กับนโยบาย แต่ดูเหมือนว่าสื่อสิ่งพิมพ์ไม่ได้ทำการเปลี่ยนแปลงใดๆ กับ robots.txt ซึ่งเป็นไฟล์ที่แจ้งให้โปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหาทราบว่า URL ใดบ้างที่สามารถเข้าถึงได้

การย้ายครั้งนี้อาจตอบสนองต่อการอัปเดตล่าสุดของนโยบายความเป็นส่วนตัวของ Google ที่เปิดเผยว่ายักษ์ใหญ่ด้านการค้นหาอาจรวบรวมข้อมูลสาธารณะจากเว็บเพื่อฝึกอบรมบริการ AI ต่างๆ เช่น Bard หรือ Cloud AI โมเดลภาษาขนาดใหญ่จำนวนมากที่ขับเคลื่อนบริการ AI ยอดนิยม เช่น ChatGPT ของ OpenAI ได้รับการฝึกอบรมเกี่ยวกับชุดข้อมูลขนาดใหญ่ที่อาจมีเนื้อหาที่มีลิขสิทธิ์หรือได้รับการคุ้มครองที่คัดลอกมาจากเว็บโดยไม่ได้รับอนุญาตจากผู้สร้างต้นฉบับ

ที่กล่าวว่า NYT ยังได้ลงนามในข้อตกลงมูลค่า 100 ล้านดอลลาร์ กับ Google ในเดือนกุมภาพันธ์ ซึ่งอนุญาตให้ยักษ์ใหญ่ด้านการค้นหาแสดงเนื้อหาของ Times ในบางแพลตฟอร์มในช่วง 3 ปีข้างหน้า สื่อสิ่งพิมพ์กล่าวว่าทั้งสองบริษัทจะทำงานร่วมกันเกี่ยวกับเครื่องมือสำหรับการเผยแพร่เนื้อหา การสมัครสมาชิก การตลาด โฆษณา และ “การทดลอง” ดังนั้นจึงเป็นไปได้ที่การเปลี่ยนแปลงข้อกำหนดในการให้บริการของ NYT จะมุ่งไปที่บริษัทอื่นๆ เช่น OpenAI หรือ Microsoft Semafor รายงานเมื่อวันอาทิตย์ว่า Times ได้ถอนตัวออกจากกลุ่มพันธมิตรด้านสื่อที่พยายามเจรจาร่วมกับบริษัทเทคโนโลยีเกี่ยวกับข้อมูลการฝึกอบรม AI ซึ่งหมายความว่าหากมีการนัดหยุดงานกับบริษัทต่างๆ ก็อาจมีความเป็นไปได้มากกว่าที่จะพิจารณาเป็นรายกรณีไป

OpenAI เพิ่งประกาศว่าผู้ดำเนินการเว็บไซต์สามารถบล็อกโปรแกรมรวบรวมข้อมูลเว็บ GPTBot จากการคัดลอกเว็บไซต์ของตนได้แล้ว ไมโครซอฟท์ยังได้เพิ่มข้อจำกัดใหม่ให้กับข้อกำหนดและเงื่อนไขของตนเองที่ห้ามไม่ให้ผู้คนใช้ผลิตภัณฑ์ AI เพื่อ “สร้าง ฝึกอบรม หรือปรับปรุงบริการ AI อื่นใด (โดยตรงหรือโดยอ้อม)” ควบคู่ไปกับการห้ามผู้ใช้จากการคัดลอกหรือดึงข้อมูลจากเครื่องมือ AI ของตน

เมื่อต้นเดือนที่ผ่านมา องค์กรข่าวหลายแห่งรวมถึง The Associated Press และ European Publishers’ Council ได้ลงนามในจดหมายเปิดผนึกเรียกร้องให้ฝ่ายนิติบัญญัติทั่วโลกนำกฎที่ต้องโปร่งใสในชุดข้อมูลการฝึกอบรมและยินยอมจากผู้ถือสิทธิ์ก่อนที่จะใช้ข้อมูลสำหรับการฝึกอบรม

view original *