OpenAI makes GPT-4 Turbo with Vision API generally available

OpenAI ได้ประกาศให้บริการโมเดล GPT-4 Turbo with Vision อันทรงพลัง แก่ผู้ใช้ทั่วไปผ่าน API ของบริษัทแล้ว ซึ่งเปิดโอกาสใหม่ๆ สำหรับองค์กรและนักพัฒนา ในการรวมความสามารถด้านภาษาและการมองเห็นขั้นสูงเข้ากับแอปพลิเคชันของตน

OpenAI has announced that its powerful GPT-4 Turbo with Vision model is now generally available through the company’s API, opening up new opportunities for enterprises and developers to integrate advanced language and vision capabilities into their applications.

OpenAI พัฒนา GPT-4 Turbo พร้อม Vision API เปิดให้ผู้ใช้ทั่วไปใช้งาน

OpenAI ได้ประกาศให้บริการโมเดล GPT-4 Turbo with Vision อันทรงพลัง แก่ผู้ใช้ทั่วไปผ่าน API ของบริษัทแล้ว ซึ่งเปิดโอกาสใหม่ๆ สำหรับองค์กรและนักพัฒนา ในการรวมความสามารถด้านภาษาและการมองเห็นขั้นสูงเข้ากับแอปพลิเคชันของตน

การเปิดตัว GPT-4 Turbo พร้อม Vision บน API เกิดขึ้นหลังจากการเปิดตัวครั้งแรกของฟีเจอร์การมองเห็นและการอัปโหลดเสียงของ GPT-4 เมื่อเดือนกันยายนปีที่แล้ว และการเปิดตัวรุ่น GPT-4 Turbo แบบเทอร์โบชาร์จที่การประชุมนักพัฒนาของ OpenAI ในเดือนพฤศจิกายน

GPT-4 Turbo สัญญาว่าจะปรับปรุงความเร็วอย่างมีนัยสำคัญ input context windows ขนาดใหญ่ขึ้น สูงสุด 128,000 โทเค็น (เทียบเท่ากับประมาณ 300 หน้า) ในค่าใช้จ่ายที่จับต้องได้มากขึ้นสำหรับนักพัฒนา

การปรับปรุงที่สำคัญคือความสามารถสำหรับ API requests เพื่อใช้ความสามารถในการจดจำการมองเห็นและการวิเคราะห์ของโมเดลผ่าน text format JSON และการเรียกใช้ฟังก์ชัน ช่วยให้นักพัฒนาสามารถสร้างข้อมูลโค้ด JSON ที่สามารถดำเนินการอัตโนมัติภายในแอปที่เชื่อมต่อ เช่น การส่งอีเมล ซื้อสินค้า หรือการโพสต์ออนไลน์ อย่างไรก็ตาม OpenAI ขอแนะนำอย่างยิ่งให้สร้างขั้นตอนการยืนยันผู้ใช้ก่อนดำเนินการที่ส่งผลกระทบต่อโลกแห่งความเป็นจริง

สตาร์ทอัพหลายแห่งกำลังใช้ประโยชน์จาก GPT-4 Turbo with Vision อยู่แล้ว ซึ่งรวมถึง Cognition ซึ่งมีเอเจนต์การเขียนโค้ด AI Devin อาศัยโมเดลเพื่อสร้างโค้ดแบบเต็มโดยอัตโนมัติ:

Healthify แอปสุขภาพและฟิตเนส ใช้โมเดลนี้เพื่อวิเคราะห์โภชนาการและคำแนะนำตามรูปภาพมื้ออาหาร:

TLDraw ซึ่งเป็นสตาร์ทอัพในสหราชอาณาจักรใช้ GPT-4 Turbo พร้อม Vision เพื่อขับเคลื่อนไวท์บอร์ดเสมือนจริงและแปลงภาพวาดของผู้ใช้ให้เป็นเว็บไซต์ที่ใช้งานได้:

แม้จะเผชิญกับการแข่งขันที่รุนแรงจากโมเดลใหม่ ๆ เช่น Claude 3 Opus ของ Anthropic และ Gemini Advanced ของ Google การเปิดตัว API น่าจะช่วยเสริมความแข็งแกร่งให้กับตำแหน่งของ OpenAI ในตลาดองค์กร ในขณะที่นักพัฒนารอคอยโมเดลภาษาขนาดใหญ่ใหม่ๆ ถัดไปของบริษัท

(ภาพโดย v2osk)

view original *