OpenAI ได้ประกาศให้บริการโมเดล GPT-4 Turbo with Vision อันทรงพลัง แก่ผู้ใช้ทั่วไปผ่าน API ของบริษัทแล้ว ซึ่งเปิดโอกาสใหม่ๆ สำหรับองค์กรและนักพัฒนา ในการรวมความสามารถด้านภาษาและการมองเห็นขั้นสูงเข้ากับแอปพลิเคชันของตน
OpenAI has announced that its powerful GPT-4 Turbo with Vision model is now generally available through the company’s API, opening up new opportunities for enterprises and developers to integrate advanced language and vision capabilities into their applications.
![](http://oneman.company/wp-content/uploads/2024/04/IMG_4983.jpeg)
OpenAI พัฒนา GPT-4 Turbo พร้อม Vision API เปิดให้ผู้ใช้ทั่วไปใช้งาน
OpenAI ได้ประกาศให้บริการโมเดล GPT-4 Turbo with Vision อันทรงพลัง แก่ผู้ใช้ทั่วไปผ่าน API ของบริษัทแล้ว ซึ่งเปิดโอกาสใหม่ๆ สำหรับองค์กรและนักพัฒนา ในการรวมความสามารถด้านภาษาและการมองเห็นขั้นสูงเข้ากับแอปพลิเคชันของตน
การเปิดตัว GPT-4 Turbo พร้อม Vision บน API เกิดขึ้นหลังจากการเปิดตัวครั้งแรกของฟีเจอร์การมองเห็นและการอัปโหลดเสียงของ GPT-4 เมื่อเดือนกันยายนปีที่แล้ว และการเปิดตัวรุ่น GPT-4 Turbo แบบเทอร์โบชาร์จที่การประชุมนักพัฒนาของ OpenAI ในเดือนพฤศจิกายน
GPT-4 Turbo สัญญาว่าจะปรับปรุงความเร็วอย่างมีนัยสำคัญ input context windows ขนาดใหญ่ขึ้น สูงสุด 128,000 โทเค็น (เทียบเท่ากับประมาณ 300 หน้า) ในค่าใช้จ่ายที่จับต้องได้มากขึ้นสำหรับนักพัฒนา
การปรับปรุงที่สำคัญคือความสามารถสำหรับ API requests เพื่อใช้ความสามารถในการจดจำการมองเห็นและการวิเคราะห์ของโมเดลผ่าน text format JSON และการเรียกใช้ฟังก์ชัน ช่วยให้นักพัฒนาสามารถสร้างข้อมูลโค้ด JSON ที่สามารถดำเนินการอัตโนมัติภายในแอปที่เชื่อมต่อ เช่น การส่งอีเมล ซื้อสินค้า หรือการโพสต์ออนไลน์ อย่างไรก็ตาม OpenAI ขอแนะนำอย่างยิ่งให้สร้างขั้นตอนการยืนยันผู้ใช้ก่อนดำเนินการที่ส่งผลกระทบต่อโลกแห่งความเป็นจริง
สตาร์ทอัพหลายแห่งกำลังใช้ประโยชน์จาก GPT-4 Turbo with Vision อยู่แล้ว ซึ่งรวมถึง Cognition ซึ่งมีเอเจนต์การเขียนโค้ด AI Devin อาศัยโมเดลเพื่อสร้างโค้ดแบบเต็มโดยอัตโนมัติ:
![](http://oneman.company/wp-content/uploads/2024/04/IMG_4980.jpeg)
Healthify แอปสุขภาพและฟิตเนส ใช้โมเดลนี้เพื่อวิเคราะห์โภชนาการและคำแนะนำตามรูปภาพมื้ออาหาร:
![](http://oneman.company/wp-content/uploads/2024/04/IMG_4981.jpeg)
TLDraw ซึ่งเป็นสตาร์ทอัพในสหราชอาณาจักรใช้ GPT-4 Turbo พร้อม Vision เพื่อขับเคลื่อนไวท์บอร์ดเสมือนจริงและแปลงภาพวาดของผู้ใช้ให้เป็นเว็บไซต์ที่ใช้งานได้:
![](http://oneman.company/wp-content/uploads/2024/04/IMG_4982.jpeg)
แม้จะเผชิญกับการแข่งขันที่รุนแรงจากโมเดลใหม่ ๆ เช่น Claude 3 Opus ของ Anthropic และ Gemini Advanced ของ Google การเปิดตัว API น่าจะช่วยเสริมความแข็งแกร่งให้กับตำแหน่งของ OpenAI ในตลาดองค์กร ในขณะที่นักพัฒนารอคอยโมเดลภาษาขนาดใหญ่ใหม่ๆ ถัดไปของบริษัท
(ภาพโดย v2osk)