คะแนน Elo บน Codeforces ของ o3 สูงกว่ารุ่นก่อนหน้าทั้งหมด โดย Elo เป็นตัวชี้วัดระดับความสามารถของผู้เข้าแข่งขันเขียนโค้ดในแพลตฟอร์ม ซึ่งสะท้อนถึงทักษะการแก้ปัญหาและการเขียนโปรแกรมในระดับสูง เนื่องจากคะแนน Elo แสดงถึงความสามารถของ AI ในการวางแผน แก้โจทย์ และปรับตัวกับปัญหาที่ซับซ้อนในสภาพแวดล้อมที่มีการแข่งขัน
3. ARC-AGI Benchmark: มาตรฐานที่ท้าทายที่สุดสำหรับ AI 🔬📊🧠
ARC-AGI คืออะไร?
ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence) เป็นมาตรฐานที่ออกแบบมาเพื่อตรวจสอบว่า AI สามารถแก้ปัญหาใหม่ ๆ ที่ไม่เคยพบเจอมาก่อนได้ดีเพียงใด โดยวัดความสามารถในการ ให้เหตุผลเชิงตรรกะ และ การเรียนรู้แบบปรับตัว ซึ่งเป็นหัวใจสำคัญของ ปัญญาประดิษฐ์ทั่วไป (AGI)
4. ความฉลาดเชิงเปรียบเทียบ: IQ ของโมเดล AI 📊🧠
ตารางแสดงการเปรียบเทียบความฉลาดของโมเดล AI ผ่านการแปลงคะแนน Codeforces Elo เป็นค่า IQ
การเปรียบเทียบความฉลาดของโมเดล AI (อ้างอิงจาก Codeforces Rating)
●
GPT-4o: IQ ~115 (1 ใน 6 คนทั่วไป)
●
o1 Preview: IQ ~123
●
o1: IQ ~135 (1 ใน 93 คน)
●
o3 mini: IQ ~141 (1 ใน 333 คน)
●
o3: IQ ~157 (1 ใน 13,333 คน)
o3 โดดเด่นในแง่ของศักยภาพการแก้ปัญหา ซึ่งทำให้เป็นหนึ่งในโมเดล AI ที่ทรงพลังที่สุด โดยแสดงให้เห็นถึงความสามารถใกล้เคียงหรือเกินกว่ามนุษย์ในบางกรณี
5. Deliberative Alignment: ยกระดับความปลอดภัยในโมเดล AI 🔒🤖🛠️
เสริมสร้างความร่วมมือกับนักวิจัยเพื่อผลักดันการพัฒนาความปลอดภัย AI frontier 🌐🔍✨
บทสรุป: ก้าวใหม่ของ AI ที่ปลอดภัยและทรงพลัง 🌟🔐🤖
โมเดล o3 และ o3-mini เป็นก้าวสำคัญของ OpenAI ที่สะท้อนถึงความก้าวหน้าทาง AI ที่ไม่เพียงแค่ตอบโจทย์ด้านการแก้ปัญหาทางวิศวกรรมซอฟต์แวร์และคณิตศาสตร์วิจัย แต่ยังมาพร้อมกับแผนการพัฒนาต่อเนื่องในอนาคต เช่น การปรับปรุงโมเดลให้สามารถใช้งานได้หลากหลายขึ้น การสร้างระบบที่รองรับการเรียนรู้ในงานที่เฉพาะเจาะจง และยังสร้างมาตรฐานใหม่สำหรับความสามารถของ AI ในการแข่งขันระดับโลก
สำหรับ event “12 Days of OpenAI ก็ปิดฉากลงไปแล้ว ตลอด 12 วัน OpenAI ได้แสดงให้เห็นถึงความมุ่งมั่นในการผลักดัน AI ให้ก้าวล้ำไปอีกขั้นผ่านการเปิดตัวฟีเจอร์และโมเดลใหม่ที่ทรงพลัง เช่น o3 และ o3-mini ที่เน้นความสามารถในการแก้ปัญหาซับซ้อน การปรับปรุงความปลอดภัยด้วย Deliberative Alignment และการเปิดโปรแกรม Early Access เพื่อให้นักวิจัยได้ร่วมสำรวจศักยภาพของ AI Frontier
ขอขอบคุณทุกท่านที่ติดตามตลอดซีรีส์นี้ และในบทความครั้งถัดไป เราจะนำเสนอรายละเอียดของทุกการเปิดตัวเพื่อให้เห็นภาพรวมทั้งหมดของ 12 Days of OpenAI อย่างครบถ้วน! ขอบคุณครับ