OpenThaiGPT: Thai Chatbot system developed as free open-source software for everyone

OpenThaiGPT ทีมนักพัฒนาที่มุ่งเน้นการสร้างระบบ Chatbot ภาษาไทยที่มีความสามารถเทียบเท่ากับ ChatGPT ได้ประกาศการพัฒนาโครงการล่าสุดของพวกเขา ทีมงานมีเป้าหมายที่จะสร้างระบบ Thai Chatbot แบบโอเพ่นซอร์สที่สามารถเชื่อมต่อกับระบบภายนอกและดึงข้อมูลได้อย่างยืดหยุ่น โครงการนี้คาดว่าจะสามารถขยายและปรับแต่งได้ง่ายและพัฒนาเป็นซอฟต์แวร์โอเพ่นซอร์สฟรีสำหรับทุกคน ทีมงานใช้ความสามารถของ Large Language Model อย่างไรก็ตาม พวกเขาเชื่อว่าความสามารถเหล่านี้จะเป็นไปได้มากขึ้นหากโมเดลเช่น ChatGPT เป็นโอเพ่นซอร์สและให้ทุกคนใช้งานได้ฟรี ไม่มีข้อผูกมัด และเปิดให้ทุกคนใช้งานได้ ในการทำเช่นนั้น ทีมงานหวังว่าจะปรับปรุงและสร้างแอปพลิเคชันหรือบริการใหม่จากการใช้ปัญญาประดิษฐ์ ซึ่งจะนำไปสู่ประโยชน์ที่สำคัญและการก้าวกระโดดทางเศรษฐกิจจากการปฏิวัติปัญญาประดิษฐ์

OpenThaiGPT, a team of developers focused on creating a Thai Chatbot system with capabilities equivalent to ChatGPT, has announced the development of their latest project. The team aims to create an open-source Thai Chatbot system that can connect to external systems and retrieve data flexibly. The project is expected to be easily expandable and customizable and developed into free open-source software for everyone to use.

The team cites the capabilities of the Large Language Model as evidence of its ability to make life easier for humans. However, they believe that these capabilities would be more feasible if models like ChatGPT were open source and freely available to anyone, free of obligation, and open to everyone to use. By doing so, the team hopes to further improve and create new applications or services from the use of artificial intelligence, leading to significant benefits and an economic leap from the artificial intelligence revolution.

Creating an LLM as capable as ChatGPT requires a huge investment, including the number of experts, the number of datasets, and the amount of GPU processing. The OpenThaiGPT team believes that if they combine their strength, manage and distribute work well, match the mission goals of every team, and help build, they will be able to take advantage of OpenThaiGPT, which is available as an LLM in Thai language that is open-source software free for everyone to use freely and free for everyone.

OpenThaiGPT has chosen to fork from the Open Assistant website due to the numerous advantages it offers. These advantages include not wasting time developing themselves, always receiving updates and fix bugs from Open Assistant, receiving raw datasets immediately when someone creates a dataset on the website, and being able to pass on the dataset to Open Assistant easily. Additionally, the team receives a Pipeline and Guideline to prepare a dataset that is a world-class standard, allowing them to release the Dataset more often, every Sunday of the week. They are also able to extend further work on tagging other information that OpenThaiGPT may use in the future or improve the system to support languages in other South-east Asia regions such as CLMV faster.

The AIEAT + AIAT Association is starting to work together with Open Dataset, Open Weight, Open Model Architecture for anyone to use. The OpenThaiGPT team believes that Thai people should have this technology of their own, and with the help of the AIEAT + AIAT Association, they will be able to achieve this goal.

ดร. กอบกฤตย์ วิริยะยุทธกร นายกสมาคมผู้ประกอบการปัญญาประดิษฐ์ 

OpenThaiGPT: ระบบ Thai Chatbot พัฒนาเป็นซอฟต์แวร์โอเพ่นซอร์สฟรีสำหรับทุกคน

OpenThaiGPT ทีมนักพัฒนาที่มุ่งเน้นการสร้างระบบ Chatbot ภาษาไทยที่มีความสามารถเทียบเท่ากับ ChatGPT ได้ประกาศการพัฒนาโครงการล่าสุดของพวกเขา ทีมงานมีเป้าหมายที่จะสร้างระบบ Thai Chatbot แบบโอเพ่นซอร์สที่สามารถเชื่อมต่อกับระบบภายนอกและดึงข้อมูลได้อย่างยืดหยุ่น โครงการนี้คาดว่าจะสามารถขยายและปรับแต่งได้ง่ายและพัฒนาเป็นซอฟต์แวร์โอเพ่นซอร์สฟรีสำหรับทุกคน

ทีมงานใช้ความสามารถของ Large Language Model อย่างไรก็ตาม พวกเขาเชื่อว่าความสามารถเหล่านี้จะเป็นไปได้มากขึ้นหากโมเดลเช่น ChatGPT เป็นโอเพ่นซอร์สและให้ทุกคนใช้งานได้ฟรี ไม่มีข้อผูกมัด และเปิดให้ทุกคนใช้งานได้ ในการทำเช่นนั้น ทีมงานหวังว่าจะปรับปรุงและสร้างแอปพลิเคชันหรือบริการใหม่จากการใช้ปัญญาประดิษฐ์ ซึ่งจะนำไปสู่ประโยชน์ที่สำคัญและการก้าวกระโดดทางเศรษฐกิจจากการปฏิวัติปัญญาประดิษฐ์

โดยใช้ Large Language Model (LLM) มาพัฒนา OpenThaiGPT ให้มีความสามารถเท่ากับ ChatGPT ดังนั้นโครงการนี้ ต้องการการลงทุนจำนวนมาก รวมถึงจำนวนผู้เชี่ยวชาญ จำนวนชุดข้อมูล และจำนวนการประมวลผล GPU ทีมงาน OpenThaiGPT เชื่อว่าหากผนึกกำลัง บริหารจัดการ กระจายงานได้ดี ตรงกับเป้าหมายภารกิจของทุกทีม และช่วยกันสร้าง จะสามารถใช้ประโยชน์จาก OpenThaiGPT ที่มี LLM เป็นภาษาไทยได้ นั่นคือ ซอฟต์แวร์โอเพ่นซอร์สฟรีสำหรับทุกคนใช้ได้อย่างอิสระและฟรีสำหรับทุกคน

OpenThaiGPT ทีมพัฒนาได้เลือกที่จะ Fork จากเว็บไซต์ Open Assistant เนื่องจากข้อดีมากมายที่มีให้ ข้อดีเหล่านี้ ได้แก่ การไม่เสียเวลาในการพัฒนาตัวเอง รับการอัปเดตและแก้ไขข้อผิดพลาดจาก Open Assistant เสมอ รับ Dataset ดิบทันทีเมื่อมีคนสร้างชุดข้อมูลบนเว็บไซต์ และสามารถส่งต่อ Dataset ไปยัง Open Assistant ได้อย่างง่ายดาย นอกจากนี้ ทีมงานยังได้รับ Pipeline และ Guideline เพื่อเตรียมชุดข้อมูลที่เป็นมาตรฐานระดับโลก ทำให้สามารถเผยแพร่ชุดข้อมูลได้บ่อยขึ้นทุกวันอาทิตย์ของสัปดาห์ พวกเขายังสามารถขยายการทำงานเพิ่มเติมในการแท็กข้อมูลอื่นๆ ที่ OpenThaiGPT อาจใช้ในอนาคต หรือปรับปรุงระบบให้รองรับภาษาในภูมิภาคเอเชียตะวันออกเฉียงใต้อื่นๆ เช่น CLMV ได้เร็วขึ้น

ด้วยความร่วมมือระหว่าง สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) และสมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT) ได้ทำงานเกี่ยวกับ Open Dataset, Open Weight, Open Model Architecture เพื่อให้ทุกคนใช้งานได้ ทีมงาน OpenThaiGPT เชื่อว่าคนไทยควรมีเทคโนโลยีนี้เป็นของตัวเอง ปัจจุบัน โครงการนี้ได้รับการสนับสนุนจากเนคเทค มหาวิทยาลัยมหิดล สถานศึกษา หน่วยงาน องค์กรธุรกิจ อีกหลายแห่ง

สำหรับผู้สนใจ สามารถศึกษาข้อมูลเพิ่มเติมได้จากเว็บไซต์ https://openthaigpt.aieat.or.th/ หรือติดต่อ สมาคมผู้ประกอบการปัญญาประดิษฐ์ประเทศไทย (AIEAT) และสมาคมปัญญาประดิษฐ์ประเทศไทย (AIAT) 

view original