15 พ.ย. เวลา 05:48 • วิทยาศาสตร์ & เทคโนโลยี

Google Gemini คว้าอันดับ 1 ในการทดสอบ Benchmark นำหน้า GPT-4 และ o1

Google ได้ประกาศความสำเร็จของ Gemini รุ่นล่าสุดซึ่งสร้างสถิติใหม่ในการทดสอบ Benchmark โดยสามารถทำคะแนนสูงกว่า AI ชั้นนำจาก OpenAI ทั้ง GPT-4 และ o1 ซึ่งเป็นผลลัพธ์ที่ได้รับการยืนยันโดย Anthropic เจ้าของ Benchmark โดยตรง
ตัวแทนจาก Anthropic กล่าวแสดงความยินดีกับ Google ที่สามารถทำสถิติใหม่นี้ได้สำเร็จ ซึ่งการก้าวขึ้นมาของ Gemini ได้กลายเป็นแรงกระตุ้นให้ OpenAI เร่งพัฒนา o1 รุ่นใหม่เพื่อให้สามารถแข่งขันได้ในอนาคต
จากรายงาน Gemini (Exp 1114) มีคะแนนนำหน้าคู่แข่งถึง 40 คะแนน และยังมีอัตราการชนะ GPT-4 และ o1 ในการทดสอบมากกว่าครึ่ง โดยมีโอกาสชนะ GPT-4 ที่ 50% และ o1 ที่ 56%
Gemini ได้แสดงความโดดเด่นใน 6 หมวดหมู่ ได้แก่ การประมวลผลคำสั่งซับซ้อน, ความสามารถทางคณิตศาสตร์, การเขียนเชิงสร้างสรรค์, การปฏิบัติตามคำสั่ง, การตอบคำถามยาว และการสนทนาในหลายรอบ อย่างไรก็ตาม Gemini ยังมีจุดอ่อนในบางด้าน เช่น การเขียนโปรแกรม ที่ยังตามหลัง GPT-4 และ o1 อยู่ รวมถึงด้านการควบคุมสไตล์การเขียนที่ยังไม่ทัดเทียม
ปัจจุบัน Google ได้เปิดให้ใช้งาน Gemini (Exp 1114) ผ่าน GoogleAI Studio พร้อมเตรียมเปิดให้ใช้งาน API สำหรับผู้พัฒนาในอนาคต
โฆษณา