31 ม.ค. เวลา 01:54 • วิทยาศาสตร์ & เทคโนโลยี

DeepSeek คือใคร ?

ทำไมแซง ChatGPT ได้
DeepSeek คือ บริษัทผู้พัฒนาด้านปัญญาประดิษฐ์จากประเทศจีน ก่อตั้งขึ้นโดยเหลียง เหวินเฟิง (Liang Wenfeng) ในเดือนพฤษภาคม 2023 บริษัทนี้เป็นที่รู้จักจากการพัฒนาโมเดลภาษาขนาดใหญ่แบบโอเพนซอร์สที่มีประสิทธิภาพสูง โดยมีสำนักงานใหญ่ตั้งอยู่ที่เมืองหางโจว มณฑลเจ้อเจียง ประเทศจีน
ในวันที่ 21 มกราคม 2025 ที่ผ่านมาทางบริษัท DeepSeek ได้เปิดตัวโมเดล DeepSeek-R1 โมเดลปัญญาประดิษฐ์ LLM แบบคิดหาเหตุผลก่อนตอบออกมา 2 ตัว ประกอบไปด้วย DeepSeek-R1-Zero และ DeepSeek-R1
DeepSeek-R1-Zero เป็นโมเดลที่ถูกฝึกด้วยหลักการ Reinforcement Learning หรือการฝึกแบบวางเป้าหมาย และให้โมเดลพยายามทำไปจนถึงเป้าหมายให้สำเร็จ
DeepSeek-R1 เป็นโมเดลที่ถูกฝึกด้วยหลักการ Supervised Fine-Tuning หรือการฝึกด้วยชุดข้อมูลการคิดเป็นเหตุเป็นผลก่อน จากนั้นจึงค่อยมาฝึกแบบ Reinforcement Learning ผลที่ได้ คือได้โมเดลที่ใกล้เคียงกับ OpenAI o1
นอกจากโมเดลตระกูล R1 ยังมีโมเดลขนาดเล็กที่ย่อมาจาก Qwen และ Llama ซึ่งแม้จะเป็นโมเดลปัญญาประดิษฐ์ขนาดเล็กแต่มีประสิทธิภาพสูงในระดับ OpenAI o1-mini โมเดลขนาดเล็กสุดมีขนาดเพียง 1.5B เท่านั้น
การเปิดตัวโมเดลปัญญาประดิษฐ์ดังกล่าวกลายเป็นหัวข้อสนทนาในวงการปัญญาประดิษฐ์ AI ทั่วโลก ซึ่งถึงความก้าวหน้าครั้งใหญ่ เพราะโมเดลมีขนาดเล็กแค่ 1.5B เท่านั้น แต่กลับมีความสามารถหลายด้านสูงกว่า OpenAI o1-mini และใช้ต้นทุนในการฝึกที่ถูกกว่า โดยใช้เงินฝึก AI ทั้งหมดไปเพียง 5.6 ล้านดอลลาร์สหรัฐ หรือประมาณ 190 ล้านบาทเท่านั้น
ด้วยผลงานดังที่กล่าวมาในข้างต้น ทำให้ในวันนี้ DeepSeek ขึ้นเป็นอันดับ 1 แอปยอดนิยมของ App Store ในสหรัฐอเมริกา แซงหน้า ChatGPT ไปเป็นที่เรียบร้อย
การที่ใช้ต้นทุนในการฝึกโมเดลที่ต่ำลง แปลว่าบริษัทขนาดเล็กจะสามารถฝึกฝนโมเดลใหม่ ๆ ได้เร็วและใช้เงินได้น้อยลง กระบวนการที่โมเดลใช้ความรู้ที่ได้จากการฝึกฝน AI ก็จะเติบโตมากขึ้นเพราะเข้าถึงทรัพยากรได้อย่างทั่วถึง ความสามารถของ DeepSeek ยังแสดงให้เห็นว่าโมเดล AI แบบโอเพนซอร์สสามารถแซงหน้าโมเดลแบบปิดได้แล้วอีกด้วย
 
 
#AI #DeepSeek #ChatGPT #AppStore #ข่าว #tnntech
#TNNTechreports #Techreports #TNNONLINE #TNNThailand #TNNช่อง16
โฆษณา