StabilityAI กำลังเปิดตัว Stable Diffusion 3.5 family ใหม่ AI image models โมเดลสร้างภาพมาพร้อมกับการปรับปรุงด้านความสมจริง การตอบสนองต่อคำสั่ง prompt และการแสดงผลตัวอักษรที่ดีขึ้นเมื่อเทียบกับ SD3 เช่นเดียวกับ SD3 รุ่นแรก
StabilityAI is today releasing its new Stable Diffusion 3.5 family of AI image models. It comes with improved realism, prompt adherence and text rendering compared to SD3.
StabilityAI เปิดตัว Stable Diffusion 3.5 — ก้าวสำคัญสู่ความสมจริงยิ่งขึ้น
StabilityAI กำลังเปิดตัว Stable Diffusion 3.5 family ใหม่ AI image models โมเดลสร้างภาพมาพร้อมกับการปรับปรุงด้านความสมจริง การตอบสนองต่อคำสั่ง prompt และการแสดงผลตัวอักษรที่ดีขึ้นเมื่อเทียบกับ SD3 เช่นเดียวกับ SD3 รุ่นแรก
Stable Diffusion 3.5 มาในสามขนาด — Large (8B), Large Turbo (8B) และ Medium (2.6B) ทั้งหมดนี้สามารถปรับแต่งได้และถูกปรับให้ทำงานบนฮาร์ดแวร์ระดับผู้บริโภค พร้อมทั้งสามารถใช้งานได้ภายใต้ Stability AI Community License โดยสรุปแล้ว นี่เป็นก้าวสำคัญที่ทำให้ผู้ใช้ทุกคนสามารถสร้างภาพ AI ที่สมจริงมากขึ้น
ในข่าวประชาสัมพันธ์ StabilityAI ยอมรับว่าโมเดล Stable Diffusion 3 Medium ที่เปิดตัวในเดือนมิถุนายน “ไม่ได้ตอบโจทย์มาตรฐานของเราหรือความคาดหวังของชุมชนอย่างเต็มที่” บริษัทเพิ่มเติมว่า “หลังจากรับฟังข้อเสนอแนะอันมีค่าจากชุมชน แทนที่จะแก้ไขอย่างเร่งด่วน เราใช้เวลาพัฒนาเวอร์ชันที่ช่วยผลักดันภารกิจของเราในการปฏิวัติสื่อภาพ”
Ryan Morrison บรรณาธิการด้าน AI ของเราได้ทดสอบ SD3.5 และกล่าวว่าเป็นการอัพเกรดที่สำคัญ โดยมีความสามารถเทียบเท่าหรืออาจเหนือกว่า Flux 1.1 Pro ที่เพิ่งเปิดตัวไป
Stability AI กล่าวว่าโมเดลที่รวมอยู่นี้มุ่งเน้นที่ความสามารถในการปรับแต่ง ประสิทธิภาพการทำงาน และผลลัพธ์ที่หลากหลาย “Stable Diffusion 3.5 โมเดลที่ทรงพลังที่สุดของเราจนถึงปัจจุบัน สะท้อนถึงความมุ่งมั่นของเราในการเสริมพลังให้ผู้สร้างสรรค์ด้วยเครื่องมือที่ทั้งเข้าถึงได้อย่างกว้างขวางและล้ำสมัย” โฆษกอธิบาย
นั่นหมายความว่าสามารถปรับแต่งภาพได้ โมเดลสามารถทำงานบนฮาร์ดแวร์ระดับผู้บริโภค “แบบพร้อมใช้งาน” และภาพที่สร้างขึ้นจะมีความเป็นเอกลักษณ์มากขึ้น นอกจากนี้ยังเน้นตัวเลือกด้านสไตล์ใหม่ๆ รวมถึงการถ่ายภาพ จิตรกรรม และอื่นๆ สามารถใช้แฮชแท็กในคำสั่ง prompt เพื่อระบุสไตล์ เช่น boho หรือแฟชั่น และยังสามารถใช้การไฮไลต์ภายในคำสั่ง prompt เพื่อนำทางโมเดลไปในทิศทางที่ต้องการได้
“นอกจากนี้ การวิเคราะห์ของเราแสดงให้เห็นว่า Stable Diffusion 3.5 Large เป็นผู้นำตลาดในด้านการตอบสนองต่อคำสั่ง prompt และสามารถแข่งขันกับโมเดลที่ใหญ่กว่าในด้านคุณภาพของภาพ” โดย “Stable Diffusion 3.5 Turbo มอบความเร็วในการประมวลผลที่เร็วที่สุดสำหรับขนาดของมัน ในขณะที่ยังคงความสามารถในการแข่งขันทั้งด้านคุณภาพของภาพและการตอบสนองต่อคำสั่ง prompt แม้เมื่อเทียบกับโมเดลที่ไม่ได้ผ่านการบีบอัดที่มีขนาดใกล้เคียงกัน”
“Stable Diffusion 3.5 Medium มีประสิทธิภาพเหนือกว่าโมเดลขนาดกลางอื่นๆ โดยมอบความสมดุลระหว่างการตอบสนองต่อคำสั่ง prompt และคุณภาพของภาพ ทำให้เป็นตัวเลือกชั้นนำสำหรับประสิทธิภาพที่มีคุณภาพสูงและมีประสิทธิภาพ”
โมเดลนี้ฟรีสำหรับการใช้งานที่ไม่ใช่เชิงพาณิชย์ รวมถึงการวิจัยทางวิทยาศาสตร์ และฟรีสำหรับธุรกิจขนาดเล็กถึงขนาดกลางที่มีรายได้ไม่เกิน 1 ล้านดอลลาร์ สำหรับการใช้งานที่เกินกว่านี้จะต้องมี Enterprise License
Prompt: a scene of a celestial garden floating in space, with trees made of crystal and flowers that glow in different colours. Planets and stars can be seen in the sky above, and a river of light flows through the garden, surrounded by statues of ancient gods and glowing orbs. Ethereal and serene.