19 ธ.ค. 2024 เวลา 14:06 • ธุรกิจ

12 Days of OpenAI: Day 9 "OpenAI o1 and new tools for developers"- เครื่องมือใหม่สำหรับการพัฒนา AI

ในวันที่ 17 ธันวาคม 2567 ซึ่งเป็นวันที่ 9 ของกิจกรรม "12 Days of OpenAI" โดยทาง OpenAI ได้เน้นไปที่การสนับสนุนนักพัฒนาและสตาร์ทอัพที่สร้างแอปพลิเคชันบน OpenAI API ผ่านการเปิดตัวฟีเจอร์ เครื่องมือ และการปรับปรุงใหม่ๆ ที่ออกแบบมาเพื่อช่วยให้งานพัฒนามีประสิทธิภาพมากขึ้นและใช้งานง่ายขึ้น นี่คือสรุปข้อมูลสำคัญจากประกาศและการสาธิตใน Day 9
ทำความรู้จักกับ API
API หรือ Application Programming Interface คือชุดของเครื่องมือและคำสั่งที่ช่วยให้แอปพลิเคชันหรือโปรแกรมต่างๆ สามารถสื่อสารและทำงานร่วมกันได้ แม้ว่าคุณจะไม่เห็นหรือใช้งาน API โดยตรง แต่ API มีบทบาทสำคัญต่อเบื้องหลังการทำงานของแอพพลืเคชั่นต่างๆ เช่น
  • เมื่อคุณใช้แอปส่งข้อความ และระบบสามารถดึงข้อมูลโปรไฟล์จาก Facebook ได้ นั่นคือการใช้ API
  • เมื่อคุณค้นหาข้อมูลจากเว็บไซต์ และข้อมูลถูกดึงมาจากฐานข้อมูล นั่นคือ API ช่วยทำงาน
ในกรณีของ OpenAI API ช่วยให้นักพัฒนาสามารถเชื่อมต่อโมเดล AI กับแอปพลิเคชันที่ผู้ใช้ทั่วไปเข้าถึงได้ เช่น ระบบผู้ช่วยเสียง, แชทบอท, หรือการตรวจสอบเอกสาร เพื่อช่วยให้การทำงานสะดวกและมีประสิทธิภาพยิ่งขึ้น
เปิดตัว OpenAI o1 ในรูปแบบ API
OpenAI o1 พร้อมให้บริการในรูปแบบ API โดยมาพร้อมกับฟีเจอร์ที่ช่วยเพิ่มความยืดหยุ่นและเพิ่มประสิทธิภาพในการใช้งานจริง
 
ฟีเจอร์สำคัญ
  • Function Calling: ช่วยให้การเชื่อมต่อกับ API ภายนอกและดึงข้อมูลที่ถูกต้องทำได้อย่างราบรื่น
  • Structured Outputs: สร้างข้อมูลที่ตรงตาม JSON Schema ที่กำหนดไว้ล่วงหน้า เหมาะสำหรับงานที่ต้องการความแม่นยำของรูปแบบข้อมูล
  • Developer Messages: วิธีใหม่ในการให้คำแนะนำแก่โมเดล โดยนักพัฒนาสามารถกำหนดบริบทหรือคำสั่งเฉพาะให้กับโมเดลได้
  • Vision Inputs: รองรับการประมวลผลด้วยภาพ
  • Reasoning Effort Parameter: ช่วยให้นักพัฒนาปรับระดับความลึกของการวิเคราะห์ของโมเดล เพื่อให้เหมาะสมกับปัญหาและต้นทุนการประมวลผล
ประสิทธิภาพที่ได้รับการปรับปรุง
  • Math (MATH @1): เพิ่มความแม่นยำจาก 85.5% เป็น 96.4%
  • Coding (Live Bench): ทำคะแนนได้ดีกว่าทั้ง o1-preview และ GPT-4o
  • Structured Outputs: เพิ่มความสม่ำเสมอในการยึดตาม JSON Schema
นอกจากนี้ o1 ยังใช้ Reasoning Tokens น้อยลงถึง 60% เมื่อเทียบกับเวอร์ชันก่อนหน้า ซึ่งช่วยลดต้นทุนและเพิ่มความเร็วในการใช้งาน
Realtime API: การพัฒนาแอปพลิเคชันที่ตอบสนองเร็วขึ้น
Realtime API ได้รับการปรับปรุงเพื่อสนับสนุนการสนทนาแบบเรียลไทม์และลดความล่าช้าในการตอบสนอง โดยมีการปรับปรุงที่สำคัญดังนี้
  • WebRTC Integration: ช่วยให้สร้างแอปพลิเคชันเสียงและวิดีโอแบบเรียลไทม์ได้ง่ายขึ้น รองรับการใช้งานทั้งบนเว็บ แอปมือถือ และ IoT
  • ลดต้นทุน: ราคาการใช้งานโทเคนเสียงของ GPT-4o ลดลง 60% และ GPT-4o Mini ถูกกว่าเดิม
ฟีเจอร์ใหม่สำหรับแอปเสียง
  • Concurrent Out-of-Band Responses: ทำงานพื้นหลัง เช่น การตรวจสอบเนื้อหา โดยไม่รบกวนการสนทนา
  • Custom Input Context: เลือกประมวลผลเฉพาะบางส่วนของประวัติการสนทนา
  • Controlled Response Timing: ช่วยเพิ่มความแม่นยำในการตอบกลับเสียงสนทนา
  • Extended Session Length: เพิ่มระยะเวลาสูงสุดต่อเซสชันจาก 15 นาทีเป็น 30 นาที
Preference Fine-Tuning: การปรับแต่งโมเดลให้ตรงความต้องการ
Preference Fine-Tuning เป็นเทคนิคใหม่ในการปรับแต่งโมเดลให้เหมาะสมกับความต้องการของผู้ใช้และนักพัฒนา โดยใช้ Direct Preference Optimization (DPO) ซึ่งช่วยเปรียบเทียบคำตอบที่ชอบและไม่ชอบเพื่อปรับปรุงโมเดล
ข้อดีของ Preference Fine-Tuning
  • เหมาะสำหรับงานเชิงสร้างสรรค์ เช่น การเขียนเนื้อหา และการสรุปข้อมูล
  • ช่วยให้โมเดลตอบสนองตามความคาดหวังของผู้ใช้ได้ดีขึ้นในงานที่คำตอบขึ้นอยู่กับโทนหรือสไตล์
ความก้าวหน้าในด้านการเขียนโค้ดและการวิเคราะห์ภาพ
OpenAI ได้แสดงความสามารถด้านการเขียนโค้ดและการวิเคราะห์ภาพของ o1
  • Coding: โมเดลสามารถตรวจจับและแก้ไขข้อผิดพลาดในการเขียนโค้ดได้ดีขึ้น โดยทำคะแนนสูงใน Live Bench
  • Vision Tasks: โมเดลสามารถตรวจจับข้อผิดพลาดในแบบฟอร์มภาษีที่สแกนได้ พร้อมอ้างอิงข้อมูลข้ามหน้าหลายหน้าเพื่อวิเคราะห์ภาพร่วมกับข้อความ
Structured Outputs ในการใช้งานจริง: โมเดลสามารถสร้าง JSON Schema ซึ่งเป็นเครื่องมือที่ใช้สำหรับกำหนดโครงสร้างของข้อมูลในรูปแบบ JSON (JavaScript Object Notation ที่สอดคล้องกับรูปแบบที่กำหนด ช่วยให้นักพัฒนาสามารถผสานข้อมูลเข้าสู่ระบบ backend ได้ง่ายขึ้น
SDK ใหม่สำหรับ Go และ Java
OpenAI เปิดตัว SDK สำหรับภาษา Go และ Java เพื่อช่วยให้นักพัฒนาสามารถเชื่อมต่อกับ API ได้สะดวก
  • Go SDK: เหมาะสำหรับการสร้างระบบ backend ที่รองรับการทำงานพร้อมกันจำนวนมาก
  • Java SDK: เหมาะสำหรับการพัฒนาซอฟต์แวร์ระดับองค์กร โดยรองรับการจัดการ API อย่างมีโครงสร้าง
การปรับปรุงเพื่อนักพัฒนาและการลดต้นทุนในการใช้ API
OpenAI มุ่งมั่นพัฒนาเครื่องมือที่ตอบโจทย์นักพัฒนา โดยมีเครื่องมือดังนี้
  • Token Efficiency: โมเดล o1 ใช้โทเคนน้อยลง ช่วยลดค่าใช้จ่าย
  • Function Calling: ปรับปรุงความแม่นยำในการเรียกใช้ฟังก์ชัน
  • Structured Outputs: ยังคงรักษาความสามารถในด้านการวิเคราะห์แม้ใช้งาน JSON Schema
หนึ่งในเป้าหมายหลักของ OpenAI คือการทำให้เทคโนโลยี AI ใช้งานได้ง่ายและคุ้มค่ามากขึ้น โมเดล o1 ใช้ทรัพยากรน้อยลงถึง 60% เมื่อเทียบกับเวอร์ชันก่อนหน้า ซึ่งหมายความว่า AI สามารถทำงานได้เร็วขึ้นและมีค่าใช้จ่ายต่ำลง
Day 9 สำคัญอย่างไร?
การเปิดตัวใน Day 9 ของกิจกรรม "12 Days of OpenAI" มีเป้าหมายซึ่งเน้นไปที่การสนับสนุนนักพัฒนา เพื่อเพิ่มขีดความสามารถของ AI และทำให้เทคโนโลยีเข้าถึงได้ง่ายขึ้นสำหรับทั้งนักพัฒนาและผู้ใช้งานทั่วไป
การเปิดตัวใน Day 9 ของ OpenAI สะท้อนถึง 3 เป้าหมายสำคัญดังนี้
  • 1.
    การทำให้ AI ฉลาดขึ้นและทำงานได้หลากหลาย: โมเดล o1 และฟีเจอร์ใหม่ๆ ช่วยเพิ่มศักยภาพในการแก้ปัญหาที่ซับซ้อนและทำงานแบบอัตโนมัติ
  • 2.
    การสนับสนุนชุมชนนักพัฒนา: OpenAI มุ่งเน้นการสร้างเครื่องมือที่ช่วยลดความซับซ้อนในการพัฒนาแอปพลิเคชันและเพิ่มความเร็วในการนำ AI ไปใช้
  • 3.
    การนำ AI มาสู่ผู้ใช้งานทั่วไป: ฟีเจอร์ที่ปรับแต่งได้และต้นทุนที่ลดลงช่วยให้ AI เข้าถึงง่ายและมีประโยชน์ในชีวิตประจำวันมากขึ้น
Event "12 Days of OpenAI" ก็ได้ผ่านมาแล้ว 9 วัน มาติดตามกันต่อกับ 3 วันสุดท้ายซึ่งจะสิ้นสุดในวันที่ 21 ธันวาคม 2567 ทาง OpenAI จะเปิดตัวเทคโนโลยีอะไรที่จะมาเขย่าโลก โปรดติดตามไปพร้อมกันกับ ChatGPT Insights นะครับ

ดูเพิ่มเติมในซีรีส์

โฆษณา