10 มี.ค. เวลา 23:00 • วิทยาศาสตร์ & เทคโนโลยี

GPT-4.5: เจาะลึก Model ใหม่ล่าสุดจาก OpenAI เพื่อก้าวต่อไปสู่ “GPT-5”

หลายคนคงได้ยินข่าวใหญ่จาก OpenAI กันแล้วว่า ตอนนี้โมเดลภาษา AI ที่ใหม่และทรงพลังที่สุดอย่าง GPT-4.5 หรือ Codename "Orion" ได้เปิดตัวอย่างเป็นทางการเรียบร้อยแล้วในช่วงปลายเดือนกุมภาพันธ์ โดยช่วงเริ่มต้นได้เปิดให้ผู้ใช้งานในระดับ Pro ได้เข้าถึงเป็นกลุ่มแรก โดยไม่จำกัดการใช้งาน ทำให้ผู้ใช้ในระดับอื่นๆตื่นเต้นจนอดใจไม่ไหวที่จะลอง แต่ล่าสุดก็ได้เปิดให้ผู้ใช้ในระดับ Paid User ได้เข้าถึงแล้วเมื่อช่วงต้นเดือนมีนาคมที่ผ่านมา โดยจำกัดการใช้งานอยู่ที่ 50 คำถาม/สัปดาห์ และจะขยายการใช้งานเพิ่มขึ้นในอนาคต
GPT-4.5 ถือเป็นก้าวสำคัญของ OpenAI ที่ถูกพัฒนาต่อยอดจาก GPT-4 และ GPT-4o ซึ่งได้รับความนิยมอย่างมากในช่วงที่ผ่านมา วันนี้เราจะมารีวิวและเจาะลึก GPT-4.5 ทุกแง่มุม ตั้งแต่จุดเด่น ความสามารถ ข้อจำกัด ไปจนถึงราคาค่าใช้จ่าย เพื่อช่วยให้คุณได้ทราบรายละเอียดในทุกแง่มุมกันครับ
เปิดตัว Model GPT-4.5 ใน ChatGPT
GPT-4.5 คืออะไร? แตกต่างจากเดิมแค่ไหน?
OpenAI ได้เปิดตัว GPT-4.5 ให้ผู้ใช้งานได้ทดลองใช้ในรูปแบบ "Research Preview" ซึ่งถือได้ว่าเป็นโมเดลที่ใหญ่ที่สุดและมีความรู้กว้างขวางที่สุดของ OpenAI ในปัจจุบัน (ต่อยอดจาก GPT-4o)โดยยืนยันว่าโมเดลนี้เป็นก้าวสำคัญที่เตรียมความพร้อมสู่ GPT-5 ในอนาคต โดยจะเป็นโมเดลสุดท้ายในตระกูล "GPT-series" ที่ไม่ใช้กระบวนการคิดแบบ Chain-of-Thought (CoT) ซึ่งจะมีประสิทธิภาพสูงขึ้นทั้งในด้านตรรกะ ความแม่นยำ ความรู้ และการตอบสนองต่อผู้ใช้
คุณสมบัติเด่นของ GPT-4.5
  • ขนาด Context สูงสุดถึง 128K tokens → รองรับข้อมูลบริบทมากขึ้น ทำให้สามารถอ่านและจดจำเอกสารยาวๆ ได้อย่างมีประสิทธิภาพ (จากเดิม 32K ใน GPT-4o)
  • ลดอัตราการตอบผิดพลาด (Hallucination) ลงเหลือเพียง 37.1% → GPT-4.5 มีการตอบที่แม่นยำขึ้น ลดข้อมูลที่ผิดพลาดจากโมเดลรุ่นก่อน
  • รองรับการประมวลผล Multimodal ได้ดีขึ้น → สามารถใช้ข้อมูลที่เป็นภาพ เสียง และข้อความร่วมกันได้ดีขึ้น
  • ปรับปรุง Emotional Intelligence (EQ) → เข้าใจภาษามนุษย์ดีขึ้นและตอบสนองได้อย่างเป็นธรรมชาติยิ่งขึ้น
  • เพิ่มประสิทธิภาพในการวิเคราะห์ข้อมูล → GPT-4.5 สามารถทำงานที่ต้องใช้ตรรกะและเหตุผลได้ดีขึ้น เช่น การคำนวณเชิงลึก และการแก้ปัญหาทางธุรกิจ
  • รองรับการใช้งานเครื่องมือเสริมใน ChatGPT ไม่ว่าจะเป็น Search, Canvas, Advance Data Analysis, และการสร้างภาพร่วมกับ Dall-E
📌 สรุปง่ายๆ: GPT-4.5 คือ AI ที่ฉลาดขึ้น แม่นยำขึ้น และตอบโต้ได้เหมือนมนุษย์มากกว่า GPT-4o อย่างเห็นได้ชัด!
สถาปัตยกรรมและโครงสร้างของโมเดล GPT-4.5
GPT-4.5 ยังคงใช้ โครงสร้างสถาปัตยกรรมแบบ Transformer เช่นเดียวกับ GPT-3 และ GPT-4 แต่ได้รับการปรับปรุงทั้งในด้าน ขนาดของโมเดลและโครงสร้างภายใน ทำให้มีความสามารถสูงขึ้นอย่างมีนัยสำคัญ แม้ว่า OpenAI จะไม่เปิดเผยจำนวนพารามิเตอร์ที่แน่ชัด แต่การที่ GPT-4.5 ได้รับการกล่าวถึงว่าเป็น “โมเดลที่ใหญ่ที่สุด” ของ OpenAI ณ ปัจจุบัน เป็นสิ่งที่บ่งชี้ว่าโมเดลนี้มีขนาด ใหญ่กว่ารุ่นก่อนหน้า ซึ่งคาดการณ์ว่ามีพารามิเตอร์ในระดับหลายแสนล้านหรือมากกว่านั้น
เพื่อให้สามารถรองรับขนาดของโมเดลที่ใหญ่ขึ้น GPT-4.5 ได้รับการฝึกบนซูเปอร์คอมพิวเตอร์ Azure AI ของ Microsoft โดยใช้ พลังการประมวลผลที่มากขึ้น ควบคู่กับการขยายขนาดของชุดข้อมูลที่ใช้ฝึก ทำให้โมเดลมีความสามารถในการเรียนรู้และเข้าใจข้อมูลจำนวนมหาศาลได้อย่างแม่นยำมากขึ้น การพัฒนาโมเดลนี้ไม่ได้เป็นเพียงแค่การเพิ่มขนาดของเครือข่ายประสาทเท่านั้น แต่ยังมีการ ปรับปรุงโครงสร้างภายในและตัวเพิ่มประสิทธิภาพ (Optimizers) เพื่อช่วยให้โมเดลสามารถประมวลผลข้อมูลได้อย่างมีประสิทธิภาพ
หนึ่งในแนวทางที่ OpenAI ใช้ในการพัฒนาโมเดล คือการแบ่งโมเดลออกเป็นสองสายหลัก ได้แก่ “o-series” ซึ่งเป็นโมเดลที่ถูกออกแบบมาเพื่อให้เหตุผลเป็นลำดับขั้น และ“GPT-series” ซึ่งเน้นการเพิ่มความรู้ผ่านการเรียนรู้แบบไม่มีผู้สอน (Unsupervised Learning) GPT-4.5 จัดอยู่ในกลุ่ม “GPT series” ซึ่งหมายความว่าโมเดลนี้ไม่ได้ถูกออกแบบมาให้คิดเป็นลำดับขั้น แต่ถูกสร้างขึ้นเพื่อจับรูปแบบและความสัมพันธ์ของข้อมูลจากแหล่งข้อมูลจำนวนมหาศาล ทำให้สามารถให้คำตอบได้อย่างรวดเร็วและมีความลื่นไหล
1
การขยายขนาดของโมเดลมาพร้อมกับ การพัฒนาเทคนิคใหม่ ๆ ในด้านการเพิ่มประสิทธิภาพ (Optimizers) และโครงสร้างเครือข่ายประสาท (Neural Network Layers) ซึ่งช่วยให้โมเดลขนาดใหญ่สามารถเรียนรู้ได้อย่างมีประสิทธิภาพมากขึ้น โดยไม่เกิดปัญหาด้านการคำนวณที่เคยพบในโมเดลขนาดใหญ่อื่น ๆ OpenAI ได้พัฒนาเทคนิคการเรียนรู้เชิงลึกให้มีประสิทธิภาพมากขึ้น ส่งผลให้ GPT-4.5 สามารถดึงข้อมูลและจับรูปแบบจากแหล่งข้อมูลจำนวนมากได้อย่างมีประสิทธิภาพยิ่งขึ้น
หนึ่งในจุดเด่นที่สำคัญของ GPT-4.5 คือ ขนาดบริบท (Context Window) ที่ขยายใหญ่ขึ้นถึง ~128,000 โทเค็น ซึ่งเป็นการพัฒนาอย่างก้าวกระโดดจาก GPT-4 ที่รองรับบริบทสูงสุดเพียง 32,000 โทเค็น ขนาดบริบทที่ใหญ่ขึ้นนี้ช่วยให้โมเดลสามารถประมวลผลข้อมูลที่ยาวขึ้นได้อย่างมีประสิทธิภาพ ความสามารถนี้มีความสำคัญอย่างยิ่งสำหรับการใช้งานในด้านที่ต้องใช้ข้อมูลเชิงลึก เช่น การวิจัย, การวิเคราะห์ข้อมูลทางธุรกิจ, และการประมวลผลข้อมูลที่ซับซ้อน
นอกจากนี้ GPT-4.5 ยังคงรองรับการรับอินพุตแบบหลายรูปแบบ (Multimodal) เช่นเดียวกับ GPT-4 ซึ่งหมายความว่าโมเดลสามารถ วิเคราะห์ทั้งข้อความและภาพได้พร้อมกัน ช่วยให้สามารถตอบคำถามเกี่ยวกับรูปภาพ หรืออธิบายเนื้อหาในภาพได้อย่างละเอียดมากขึ้น อย่างไรก็ตาม แม้ว่าจะสามารถรองรับภาพได้ แต่ใน ChatGPT เวอร์ชันปัจจุบันของ GPT-4.5 ยังไม่มีฟีเจอร์ด้านเสียงหรือวิดีโอ ซึ่งอาจเป็นสิ่งที่ OpenAI กำลังพัฒนาในอนาคต
สรุปแล้ว GPT-4.5 ยังคงยืนอยู่บนพื้นฐานของ GPT-4 แต่ได้รับการขยายขนาดให้ใหญ่ขึ้น รองรับบริบทที่ยาวขึ้น และได้รับการพัฒนาให้สามารถเรียนรู้และดึงข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น แม้ว่าโมเดลนี้จะไม่มีโครงสร้าง “เว้นช่วงคิด” ภายในก่อนตอบเหมือนโมเดลให้เหตุผล แต่สามารถ ใช้พลังของเครือข่ายขนาดใหญ่ในการวิเคราะห์และสร้างคำตอบที่มีความลื่นไหลและเป็นธรรมชาติมากขึ้น ทำให้ GPT-4.5 เป็นอีกก้าวสำคัญของ OpenAI ในการพัฒนา AI ที่สามารถเรียนรู้และทำความเข้าใจข้อมูลได้อย่างลึกซึ้งมากขึ้น
ความแตกต่างจาก GPT-4 และเวอร์ชันก่อนหน้า
GPT-4.5 ถูกมองว่าเป็นก้าวย่อย (“4.5”) ก่อนการเปลี่ยนผ่านไปสู่ยุคใหม่ของโมเดล GPT ในอนาคต โดยทาง OpenAI ได้ประกาศไว้ว่า GPT-4.5 เปิดตัวในสถานะ research preview (รุ่นให้ทดลองใช้เพื่อการวิจัย) โดยมีจุดมุ่งหมายเพื่อเก็บฟีดแบ็กและทำความเข้าใจขอบเขตความสามารถและข้อจำกัดของโมเดลนี้อย่างรอบด้านก่อนจะก้าวสู่รุ่นถัดไป และคาดว่า GPT-4.5 จะเป็นโมเดล GPT รุ่นสุดท้ายที่ยังไม่ได้รวมความสามารถแบบ chain-of-thought reasoning (การให้โมเดลคิดทีละขั้นตอนเหมือนการใช้เหตุผลเชิงตรรกะ) เข้ามา
Sam Altman CEO ของ OpenAI ได้พูดไว้ว่าเป้าหมายต่อไปคือการรวมจุดแข็งของโมเดลตระกูล GPT กับโมเดลตระกูลเหตุผล (เช่นซีรีส์ o-model อย่าง o1, o3) ให้เป็นหนึ่งเดียวใน GPT-5 เพื่อพัฒนาไปสู่ “ระบบปัญญาประดิษฐ์แบบรวมเป็นหนึ่ง” ที่ผู้ใช้ไม่ต้องเลือกโมเดลย่อยเอง ซึ่งแสดงให้เห็นว่า GPT-4.5 เป็นการแก้ปัญหาระยะสั้นเพื่อเพิ่มความสามารถเชิงสนทนาและความรู้ เพื่อเตรียมพร้อมก่อนที่จะมีการพัฒนาในด้านสถาปัตยกรรมที่จะมาถึงใน GPT-5
1
GPT-4.5 มีการเปลี่ยนแปลงและปรับปรุงหลายด้านเมื่อเทียบกับ GPT-4 และ GPT-3 ทั้งในแง่ความสามารถและพฤติกรรมของโมเดล จุดเด่นที่สังเกตได้คือโมเดลรุ่นใหม่นี้ถูกออกแบบมาเพื่อการสนทนาที่เป็นธรรมชาติและเข้าใจบริบทผู้ใช้ได้ดียิ่งขึ้น มากกว่าที่จะมุ่งเน้นการแก้ปัญหาเชิงตรรกะหรือคำนวณทีละขั้นตอนโดยตรง โมเดล GPT-4.5 มีฐานความรู้ที่กว้างขึ้นและสามารถเชื่อมโยงข้อมูลต่าง ๆ ได้ดีขึ้น ทำให้ตอบคำถามความรู้ทั่วไปได้แม่นยำขึ้นและลดโอกาสให้ข้อมูลเท็จ (hallucination) ลงเมื่อเทียบกับ GPT-4​
นอกจากนี้ GPT-4.5 ยังถูกระบุว่ามี “EQ” หรือความฉลาดทางอารมณ์สูงขึ้น สามารถจับโทนความรู้สึกของผู้ใช้และตอบสนองได้อย่างเหมาะสมยิ่งขึ้น สิ่งนี้เห็นได้ชัดจากตัวอย่างการสนทนาที่ OpenAI เปรียบเทียบระหว่าง GPT-4.5 กับ GPT-4o โดยจากการทดสอบเมื่อผู้ใช้บอกว่ารู้สึกแย่จากการสอบตก GPT-4.5 ตอบกลับด้วยน้ำเสียงที่ให้กำลังใจและชวนพูดคุยเพิ่มเติมอย่างเป็นมิตร ขณะที่ GPT-4o มักตอบด้วยการให้คำแนะนำเป็นขั้นตอนยาว ๆ ตามแบบฉบับเครื่องจักร แสดงให้เห็นถึงความแตกต่างที่ GPT-4.5 มีความเป็นมนุษย์และเห็นใจผู้ใช้มากกว่า
1
ในชุดทดสอบ SimpleQA (ถามตอบความรู้ทั่วไป) GPT-4.5 ทำคะแนนความแม่นยำได้สูงถึง 62.5% ในขณะที่ GPT-4o เดิมทำได้ ~38% และ Model “O-serie” (OpenAI o1, o3-mini) ประมาณ 47%​ สอดคล้องกับการสังเกตว่าฐานความรู้ของ GPT-4.5 นั้นกว้างขวางที่สุดในบรรดาโมเดล GPT ทั้งหมด ณ ตอนนี้
ผลการทดสอบ SimpleQA (ถามตอบความรู้ทั่วไป) เปรียบเทียบระหว่าง Model ของ OpenAI
ข้อมูลการฝึก (Training Data) และกระบวนการ Fine-tuning
ชุดข้อมูลการฝึกและกระบวนการปรับแต่งโมเดลของ GPT-4.5 มีการพัฒนาให้ก้าวหน้าจากรุ่นก่อนหน้าอย่างมีนัยสำคัญ OpenAI ยังคงใช้นโยบาย ไม่เปิดเผยรายละเอียดชุดข้อมูลการฝึกเต็มรูปแบบ ด้วยเหตุผลทางการแข่งขันและความปลอดภัย แต่ได้ระบุคร่าว ๆ ว่า GPT-4.5 ถูกฝึกด้วย “ข้อมูลที่หลากหลายจากอินเทอร์เน็ต หนังสือ และแหล่งข้อมูลอื่น ๆ ที่ทันสมัย” ครอบคลุมความรู้หลายแขนงและหลายภาษา เพื่อให้โมเดลมีความรู้ครอบจักรวาลมากที่สุดเท่าที่จะเป็นไปได้​
จากการตรวจสอบจากใช้งาน GPT-4.5 ใน ChatGPT พบว่าฐานข้อมูลการเรียนรู้ของครอบคลุมถึงเดือนตุลาคม 2023 และสามารถดึงข้อมูลเรียลไทม์ ผ่านเครื่องมือ “Search” ที่ช่วยให้สามารถค้นหาและอัพเดทข้อมูลในปัจจุบันได้ โดยทาง OpenAI มีแผนในการพัฒนาและปรับฐานความรู้ของ Model เพิ่มขึ้นในอนาคต
ฐานข้อมูลการเรียนรู้ของ GPT-4.5 ครอบคลุมถึงเดือนตุลาคม 2023
หนึ่งในเทคนิคใหม่ที่ OpenAI นำมาใช้คือ การสร้างชุดข้อมูลฝึกจากโมเดลเล็ก กล่าวคือ แทนที่จะอาศัยแต่ข้อมูลที่มนุษย์สร้างหรือจัดเตรียมให้ทั้งหมด OpenAI ได้ใช้โมเดลขนาดเล็ก (เช่น GPT-4o หรือ o1-mini) มาช่วยสร้างข้อมูลหรือสรุปย่อบทสนทนา แล้วนำข้อมูลเหล่านั้นมาใช้ฝึกโมเดล GPT-4.5 ต่ออีกขั้น
เทคนิคนี้ช่วยให้สามารถผลิตชุดข้อมูลฝึกสอนพฤติกรรม (เช่น บทสนทนาเชิงบริบท, ตัวอย่างการทำตามคำสั่ง) จำนวนมหาศาลได้อย่างรวดเร็วและปรับแต่งได้ง่าย โดยไม่ต้องพึ่งมนุษย์ ซึ่ง OpenAI ระบุว่ามันช่วยพัฒนาความสามารถในการควบคุมทิศทางการตอบ (steerability), ความเข้าใจนัยยะและความละเอียดอ่อนของภาษา, และการสนทนาอย่างเป็นธรรมชาติของ GPT-4.5 ได้อย่างมาก​
หลังผ่านการ Pre-training (การฝึกเบื้องต้น) ด้วยข้อมูลมหาศาลแบบไม่มีผู้สอนบน Azure ซึ่งเป็นขั้นตอนที่กินเวลานานและทรัพยากรมหาศาล มีรายงานไม่เป็นทางการว่าต้องใช้ GPU ระดับหมื่น ๆ ตัวและเวลาฝึกหลายเดือน โมเดลจะถูกนำมาปรับแต่งแบบมีผู้สอน (Supervised Fine-tuning) และ เรียนรู้เสริมแรงจากการตอบกลับของมนุษย์ (RLHF) เพื่อให้แน่ใจว่าสามารถทำตามคำสั่งผู้ใช้และสร้างผลลัพธ์ที่สอดคล้องกับความตั้งใจของผู้ใช้ และเสริมด้วย “เทคนิคการควบคุมแบบใหม่” เพื่อเพิ่มประสิทธิภาพ​
การฝึก GPT-4.5 ใช้พลังการประมวลผลและต้นทุนในการพัฒนาอย่างมหาศาล เพื่อให้ได้การเรียนรู้ที่ครอบคลุมชุดข้อมูลขนาดใหญ่มาก สะท้อนให้เห็นถึงแนวคิดของ OpenAI ที่ว่า “ทุกๆ การเพิ่มขึ้นของขนาดการคำนวณ (compute) ในระดับเลขยกกำลัง จะนำมาซึ่งความสามารถใหม่ ๆ ของ AI”​
โดยสรุป การฝึก GPT-4.5 ยังคงใช้ข้อมูลขนาดมหึมาจากหลายแหล่งผสานกับการปรับแต่งเชิงคุณภาพด้วยมนุษย์ แต่ได้เพิ่มกลยุทธ์ใหม่ ๆ โดยการใช้ประโยชน์จากโมเดลเล็กสร้างข้อมูลฝึก และการสอนด้านความร่วมมือกับมนุษย์ (human collaboration) ทำให้ GPT-4.5 มีความพร้อมในการทำงานร่วมกับผู้ใช้ได้ “รู้ใจ” มากขึ้น อย่างไรก็ตาม เนื่องจากการฝึกโมเดลขนาดยักษ์ยังคงมีลักษณะปิด ผู้เชี่ยวชาญบางส่วนก็เรียกร้องให้ OpenAI เพิ่มความโปร่งใสเกี่ยวกับข้อมูลที่ใช้ฝึกและวิธีการปรับแต่ง เพื่อให้สามารถประเมินอคติและความเสี่ยงได้เต็มที่​
GPT-4.5 เก่งแค่ไหน? ผลการทดสอบ Benchmark ล่าสุด
ข้อมูลจากการวัดผล Benchmark แสดงให้เห็นถึงความสามารถที่สูงขึ้นของ GPT-4.5 อย่างชัดเจน เมื่อเปรียบเทียบ Model อื่นๆ ของ OpenAI ดังนี้
  • วิทยาศาสตร์ (GPQA): GPT-4.5 ทำคะแนนได้ 71.4% ดีกว่า GPT-4o (53.6%) แต่ยังด้อยกว่า OpenAI o3-mini (79.7%)
  • คณิตศาสตร์ (AIME ’24): GPT-4.5 ทำคะแนนได้ 36.7% ดีกว่า GPT-4o (9.3%) อย่างชัดเจน แต่ยังตามหลัง OpenAI o3-mini (87.3%) มาก
  • ความรู้หลายภาษา (MMMLU): GPT-4.5 ทำคะแนนดีที่สุด 85.1% สูงกว่า GPT-4o (81.5%) และ OpenAI o3-mini (81.1%)
  • Multimodal (MMMU): GPT-4.5 ทำคะแนนดีที่สุดที่ 74.4% สูงกว่า GPT-4o (69.1%) ส่วน OpenAI o3-mini ไม่มีข้อมูล
ผล Benchmark เปรียบเทียบประสิทธิภาพระหว่าง Model ของ OpenAI
  • การเขียนโค้ดขั้นสูง (SWE-Lancer): GPT-4.5 ทำคะแนนดีที่สุด 32.6% ดีกว่า GPT-4o (23.3%) และ OpenAI o3-mini (10.8%)
  • การเขียนโค้ดที่ผ่านการตรวจสอบ (SWE-Bench): GPT-4.5 ทำได้ 38.0% ดีกว่า GPT-4o (30.7%) แต่ด้อยกว่า OpenAI o3-mini (61.0%)
ในส่วนการประเมินความสามารถจาก lmarena.ai เว็บไซต์ยอดนิยมที่ใช้ในการวัดประสิทธิภาพของโมเดล AI ต่างๆ โดยมีเกณฑ์ที่ครอบคลุมหลากหลายด้าน ตั้งแต่การตอบคำถามทั่วไปไปจนถึงงานที่มีความซับซ้อนสูง จากผลการเปรียบเทียบล่าสุดของ GPT-4.5 เวอร์ชัน Research Preview สามารถทำคะแนนเป็นอันดับที่ 1 ในทุกหมวดหมู่ ที่มีการทดสอบ โดยสรุปรายละเอียดแต่ละหมวดหมู่ที่โดดเด่นได้ดังนี้
  • Overall & Overall with Style Control: GPT-4.5 ทำคะแนนรวมได้อันดับที่ 1 หมายถึงสามารถตอบคำถามได้ดีในภาพรวมทุกหมวดหมู่ เมื่อเทียบกับโมเดลที่เป็นคู่แข่งสำคัญ เช่น GPT-4o, Grok-3, Gemini-2 และ Claude-3.7
  • Hard Prompts: GPT-4.5 สามารถตอบโจทย์ที่มีความซับซ้อนและมีบริบทที่ยากได้ดีที่สุด สะท้อนถึงความสามารถในการทำความเข้าใจคำสั่งที่ซับซ้อน เข้าใจเจตนาที่แท้จริงของผู้ใช้งาน และสามารถให้คำตอบที่ตรงประเด็นมากที่สุด
ผลการประเมินความสามารถเปรียบเทียบระหว่าง AI ในด้านต่างๆจาก lmarena.ai
  • Style Control: GPT-4.5 มีคะแนนสูงสุดในด้านการปรับสไตล์การเขียนตามคำสั่งของผู้ใช้ สามารถเข้าใจบริบทของผู้ใช้งานอย่างลึกซึ้งและสามารถผลิตเนื้อหาที่สอดคล้องกับรูปแบบที่ผู้ใช้งานต้องการได้ดี
  • Coding: GPT-4.5 มีประสิทธิภาพสูงสุดในการเขียนโค้ดทั้งการแก้ไข (Debugging) การอธิบายโค้ดที่ซับซ้อน และการสร้างโค้ดใหม่จากโจทย์ที่มีความยากสูง
  • Math: GPT-4.5 ทำคะแนนในหมวดคณิตศาสตร์ได้สูงสุด ซึ่งแสดงให้เห็นถึงความก้าวหน้าด้านการประมวลผลตรรกะและการคำนวณที่มีความแม่นยำมากขึ้น
การจัดอันดับโมเดล AI ตามคะแนน Arena Score ซึ่งเป็นผลจากการโหวตโดยผู้ใช้งานจริงจาก lmarena.ai
  • Creative Writing: GPT-4.5 ได้อันดับ 1 ในด้านสร้างเนื้อหาที่มีความคิดสร้างสรรค์ เป็นธรรมชาติ มีจินตนาการที่หลากหลาย
  • Instruction Following: GPT-4.5 ได้คะแนนสูงสุดในด้านการเข้าใจและปฏิบัติตามคำสั่งได้ตรงความต้องการของผู้ใช้มากที่สุด
  • Longer Query: GPT-4.5 รองรับบริบทคำถามที่ยาวได้ดีขึ้นอย่างชัดเจน
  • Multi-turn Conversation: GPT-4.5 มีความสามารถในการสนทนาและโต้ตอบหลายรอบ (Multi-turn) ได้ดีที่สุด ซึ่งเหมาะอย่างยิ่งสำหรับงานที่ต้องการความต่อเนื่องในการสนทนาอย่างมีประสิทธิภาพ
ในส่วนของผลการเปรียบเทียบระหว่าง GPT-4.5 และ GPT-4o จากการประเมลผลโดยผู้ทดสอบที่เป็นมนุษย์ (Human testers) ซึ่งวัดจากการตอบสนองต่อโจทย์หรือคำถามใน 3 ด้านหลัก ได้แก่
  • 1.
    Everyday queries (คำถามในชีวิตประจำวัน): GPT-4.5 มีอัตราการตอบชนะ GPT-4o ที่ 57.0%
  • 2.
    Professional queries (คำถามระดับมืออาชีพ): GPT-4.5 มีอัตราการตอบชนะ GPT-4o สูงที่สุดที่ 63.2%
  • 3.
    Creative intelligence (การตอบสนองด้านความคิดสร้างสรรค์): GPT-4.5 มีอัตราการตอบชนะ GPT-4o ที่ 56.8%
ผลการทดสอบ IQ ของ GPT-4.5 เทียบกับ AI อื่นๆ
นอกจาก Benchmark แล้ว GPT-4.5 ยังถูกนำไปทดสอบ IQ เทียบกับ AI อื่นๆ โดยอ้างอิงผลการทดสอบจาก trackingai.org โดยรายละเอียดการทดสอบมีดังนี้
  • 1.
    "Offline IQ Test" หมายถึงการทดสอบวัดระดับเชาวน์ปัญญาที่ดำเนินการในสภาพแวดล้อมที่ไม่มีการเชื่อมต่ออินเทอร์เน็ตหรือไม่มีการเข้าถึงข้อมูลออนไลน์ ซึ่งถูกออกแบบมาเพื่อประเมินความสามารถในการคิดวิเคราะห์ การแก้ปัญหา และการใช้เหตุผลของบุคคลหรือระบบ AI
  • 2.
    "Mensa Norway IQ Test" เป็นการทดสอบวัดระดับเชาวน์ปัญญาที่พัฒนาโดย Mensa Norway ที่มีชื่อเสียงในการทดสอบ IQ ทั่วโลก การทดสอบนี้ถูกออกแบบมาเพื่อประเมินความสามารถในการคิดเชิงตรรกะและการแก้ปัญหา โดยไม่จำเป็นต้องมีความรู้เฉพาะทาง​
ผลการทดสอบทางด้าน IQ จาก trackingai.org
จากผลการทดสอบพบว่า ในด้าน Offline IQ Test GPT-4.5 ได้คะแนน 97 คะแนน ซึ่งจัดอยู่ในกลุ่ม AI ที่มีระดับความฉลาดใกล้เคียงกับมนุษย์เฉลี่ยที่อยู่ในช่วง IQ 90-110 ในส่วนของ Mensa Norway IQ Test GPT-4.5 ได้คะแนน 94 คะแนน ถือว่าสูงในกลุ่ม AI และแสดงให้เห็นถึงความสามารถในการแก้ปัญหาและเหตุผลเชิงตรรกะที่ดีเยี่ยม
ผลการทดสอบทางด้าน IQ จาก trackingai.org
ข้อดีและข้อเสียขอว GPT-4.5 ที่ถูกพูดถึงมากที่สุด
จากประสบการณ์ของผู้ใช้จริงและนักพัฒนาที่ได้ลอง GPT-4.5 มีการพูดถึงคุณสมบัติเด่นและจุดอ่อนหลักๆ ดังนี้
  • ข้อดี: GPT-4.5 มีความแม่นยำด้านข้อเท็จจริงสูงกว่าเดิมและมีแนวโน้มสร้างคำตอบผิดพลาดลดลงอย่างชัดเจน ผู้ใช้สังเกตว่าคำตอบดูเป็นธรรมชาติและมี โทน ที่เป็นมิตรมากขึ้น สามารถรักษาบริบทการสนทนาและน้ำเสียงตามที่ผู้ใช้ต้องการได้ดีขึ้น นอกจากนี้โมเดลที่ใหญ่ขึ้นนี้ยังมีความรู้กว้างขวางขึ้น ทำให้ตอบคำถามได้ครอบคลุมและละเอียดขึ้น รวมถึงโดดเด่นกว่า Model อื่นๆ ในด้าน "EQ"
ราคา API ของ GPT-4.5 เมื่อเปรียบเทียบกับ Model อื่นๆ ใน "GPT-Series"
  • ข้อเสีย: จุดอ่อนที่ถูกพูดถึงมากที่สุดคือ ต้นทุนและความเร็ว ของ GPT-4.5 – โมเดลนี้มีขนาดใหญ่มากจน Sam Altman ซีอีโอของ OpenAI เรียกมันว่า “โมเดลยักษ์ราคาแพง” สำหรับนักพัฒนาที่เรียกใช้ผ่าน API ค่าใช้จ่ายก็สูงกว่ารุ่นก่อนหลายเท่าตัว ราคาคิดที่ประมาณ $75 ต่อ 1 ล้านโทเคนอินพุต และ $150 ต่อ 1 ล้านโทเคนเอาต์พุต ซึ่งแพงกว่าราคา GPT-4o เดิมถึง 30 เท่า ทำให้หลายคนกังวลว่าประสิทธิภาพที่เพิ่มขึ้นอาจไม่คุ้มกับค่าใช้จ่ายที่พุ่งสูงขึ้น
1
สรุป: GPT-4.5 ก้าวสำคัญก่อนการมาถึงของ GPT-5
GPT-4.5 เป็นก้าวสำคัญของ OpenAI ในการขยายขอบเขตของโมเดลภาษาขนาดใหญ่ ที่แสดงให้เห็นถึงการเพิ่มพลังการฝึกและนวัตกรรมด้านสถาปัตยกรรมสามารถยกระดับความสามารถของ AI ในการสนทนาและเข้าใจโลกได้มากขึ้น GPT-4.5 ได้ผสมผสานความรู้ปริมาณมหาศาล เข้ากับความเข้าใจความต้องการมนุษย์ ทำให้เกิดโมเดลที่มีทั้ง “IQ” และ “EQ” ในระดับที่สูงกว่าเดิม ส่งผลให้การโต้ตอบกับ AI มีความเป็นธรรมชาติและน่าเชื่อถือขึ้น แต่ขณะเดียวกันก็เผยให้เห็นขีดจำกัดไม่ว่าจะเป็นการให้เหตุผลเชิงลึก, ต้นทุนการใช้งาน, หรือความเสี่ยงด้านจริยธรรม
จากการเปิดตัว GPT-4.5 ยืนยันแนวโน้มว่า การพัฒนา AI ระดับสูงขึ้นนั้นต้องเดินหลายมิติไปพร้อมกัน ทั้งขยายโมเดลให้เก่งขึ้น (unsupervised scaling) และปรับปรุงวิธีคิดของโมเดล (reasoning) รวมถึงใส่ใจเรื่องความปลอดภัยควบคู่ ทุกโมเดลใหม่ไม่เพียงแต่เก่งขึ้น แต่ควรปลอดภัยขึ้นด้วย และ GPT-4.5 ก็พยายามทำตามแนวคิดนี้โดยลดความเสี่ยงในหลายด้านเมื่อเทียบกับรุ่นก่อน
2
ในอนาคต เราคงได้เห็นการผสานรวมจุดแข็งต่าง ๆ ของ AI เข้าด้วยกัน ส่งผลให้ AI เข้าใกล้ความสามารถระดับมนุษย์ยิ่งขึ้นไปอีก พร้อมกับความท้าทายใหม่ ๆ ที่จะตามมา สิ่งสำคัญคือการใช้ AI อย่างมีความรับผิดชอบและความเข้าใจ จะเป็นเครื่องมืออันทรงพลังที่จะก่อประโยชน์มหาศาล แต่หากใช้ผิดวิธีก็อาจก่อปัญหาได้เช่นกัน ความร่วมมือระหว่างนักพัฒนา ผู้ใช้งาน นักวิจัยด้านจริยธรรม และสังคม จะเป็นกุญแจให้เราได้รับประโยชน์เต็มที่จาก GPT-4.5 และ AI รุ่นถัด ๆ ไป ในขณะที่ยังรักษาคุณค่าพื้นฐานและความปลอดภัยของมนุษยชาติเอาไว้
แล้วคุณล่ะ คิดอย่างไรกับ GPT-4.5? มาร่วมพูดคุยกันครับ!
Reference Source
1. OpenAI – Introducing GPT-4.5
2. lmarena.ai – AI Benchmark Leaderboard
3. GPT-4.5 System Card – OpenAI
4. Mensa Norway & Offline IQ Tests
5. OpenAI API Pricing
โฆษณา