27 ม.ค. เวลา 09:06 • วิทยาศาสตร์ & เทคโนโลยี

Deepseek AI ที่ทำให้โลกทึ่ง

หากใครติดตามข่าวเรื่อง AI ก็คงจะได้ยิน AI ตัวใหม่ที่ชื่อว่า Deepseek มากันบ้าง และมันก็ทำให้โลกทึ่งทั้งๆ ที่มันเพิ่งเปิดตัวมาได้ไม่กี่วัน
3
ก่อนหน้านี้ OpenAI ตั้งตัวเองมาว่าจะเปิดเทคนิคในการทำงานของตน แต่ในที่สุดก็ปิดไป ส่วนตัวอื่นๆ ก็ออกมาแบบไม่เปิดโค้ด จะมีบ้างที่ดังๆ ก็เช่น Llama จาก Facebook และ Qwen จาก Alibaba
แต่จู่ๆ Deepseek ก็เปิดตัวออกมา แถมยังมีผลการทำงานดีกว่า และเร็วกว่าคู่แข่งที่ระดับขนาดโมเดลเดียวกัน หลายๆ คนเลยสงสัยที่มาที่ไปของ AI ตัวนี้
1
AI ตัวนี้มีที่มาจากหน่วยงานวิจัยที่ชื่อว่า Fire Flyer ซึ่งเป็นหน่วยงานหนึ่งของกองทุนเฮดจ์ฟันด์ในจีนที่ชื่อ High Flyer ที่ตอนจุดพีค เคยมีเงินลงทุนมากกว่า 15 พันล้านเหรียญสหรัฐ
ก่อนหน้านี้ High Flyer ได้สะสม GPU เพื่อเอามาสร้าง supercomputer ไว้ใช้วิเคราะห์ข้อมูลทางการเงิน เพื่อลงทุน และในภายหลังได้ตั้ง Fire Flyer และต่อมากลายมาเป็น Deepseek โดยตอนแรก เริ่มจากความสนใจอยากรู้อยากลอง และได้รวบรวมนักพัฒนาจากมหาวิทยาลัยต่างๆ ของจีนมาช่วยกัน ท่ามกลางการปิดกั้นการเข้าถึงเทคโนโลยี AI ของสหรัฐอเมริกาตั้งแต่ปี 2022 แต่โชคดีที่บริษัทนี้มี Nvidia H100 ตุนไว้เป็นหมื่นเลยทำให้ยังพัฒนาต่อได้
1
และการที่การพัฒนาของมันเป็นแบบเปิด และได้ระดมหัวกะทิจากมหาวิทยาลัยต่างๆ ทำให้การพัฒนาของมันเร็ว และเจ๋งไม่แพ้ AI ของสหรัฐอเมริกาเลยทีเดียว
โดยโมเดลที่ใหญ่ที่สุด 671 พันล้าน parameters ใช้เวลาเทรนเพียง 55 วัน และใช้เงินไป 5.58 ล้านเหรียญสหรัฐ บนข้อมูลมากถึง 14.8 ล้านล้าน tokens ซึ่งถูกกว่าโมเดลอื่นอย่างเห็นได้ชัด
1
โฆษณา