29 ม.ค. เวลา 09:18 • วิทยาศาสตร์ & เทคโนโลยี

สรุปความสามารถ “Janus Pro” AI สร้างรูปภาพฟรี จาก DeepSeek อีกหนึ่งคู่แข่งตัวโหดของ OpenAI

ไม่กี่วันมานี้ มี AI ตัวใหม่จากจีนที่ชื่อว่า “DeepSeek” กำลังมาแรง
ซึ่งนอกจากจะเป็น AI ที่ถาม-ตอบเรื่องทั่ว ๆ ไป ช่วยแก้ไขปัญหาที่ซับซ้อนได้แล้ว ยังขึ้นชื่อว่าเป็นคู่แข่งตัวโหดของ ChatGPT อีกด้วย
ที่น่าสนใจคือ DeepSeek ยังได้เปิดตัวเครื่องมือ AI ใหม่ มีชื่อว่า “Janus Pro” ที่มีความสามารถในการสร้างรูปภาพตามคำสั่งได้
รวมถึงวิเคราะห์ข้อมูลจากรูปภาพ โดยอัปโหลดรูปภาพที่มีอยู่ หรือเปิดกล้องถ่ายภาพ จากนั้นก็พิมพ์คำถามที่ต้องการ AI ก็จะวิเคราะห์และตอบคำถามให้ทันที
แล้วนอกจากนี้ Janus Pro ยังมีอะไรน่าสนใจอีกบ้าง ? MarketThink สรุปมาให้เป็นข้อ ๆ
1. ภาพรวมของ Janus Pro
Janus Pro ประกอบไปด้วย 2 โมเดล ได้แก่
- Janus-Pro-1B (1,000 ล้านพารามิเตอร์)
- Janus-Pro-7B (7,000 ล้านพารามิเตอร์)
อธิบายค่าพารามิเตอร์ง่าย ๆ ก็คือ เป็นค่าตัวเลขที่โมเดล AI ใช้ในการประมวลผลข้อมูลและสร้างผลลัพธ์
โดยจำนวนพารามิเตอร์ที่มากขึ้น จะสัมพันธ์กับความสามารถและความซับซ้อนของโมเดล หรือก็คือ “ยิ่งมีค่าพารามิเตอร์เยอะ AI ก็ยิ่งเก่งขึ้น” นั่นเอง
 
และที่สำคัญคือ หากโมเดล AI มีจำนวนพารามิเตอร์มาก ก็ยิ่งต้องใช้ทรัพยากรในการประมวลผลและหน่วยความจำที่มากขึ้นตามไปด้วย
2. ความสามารถและกระบวนการทำงานของ Janus Pro
ในเวลานี้ Janus Pro สามารถสร้างรูปภาพที่มีความละเอียดได้ที่ 384x384 พิกเซล
โดยขั้นตอนการสร้างรูปภาพมาจากการประมวลชุดข้อมูลการฝึกขนาดใหญ่ที่มีมากกว่า 90 ล้านตัวอย่าง
ท่ีรวมข้อมูลสังเคราะห์ไปแล้วประมาณ 72 ล้านชุด
อธิบายง่าย ๆ ก็คือในชุดข้อมูลตัวอย่างกว่า 90 ล้าน เป็นข้อมูลเทียมที่สร้างโดยอัลกอริทึมหรือการจำลองด้วยคอมพิวเตอร์ประมาณ 72 ล้านชุด
ซึ่งจากการประมวลผลชุดข้อมูลตัวอย่างจำนวนมหาศาลนี้ ทำให้ Janus Pro มีความสามารถในการวิเคราะห์ภาพขั้นสูง, จดจำวัตถุและองค์ประกอบในภาพ รวมถึงตอบคำถามที่เกี่ยวข้องกับภาพได้อย่างแม่นยำ
ที่น่าสนใจคือ รูปภาพที่สร้างขึ้นจาก Janus Pro ยังสามารถนำใช้งานในเชิงพาณิชย์ได้โดยไม่มีข้อจำกัดอีกด้วย
3. เทียบประสิทธิภาพของ Janus Pro กับเครื่องมือสร้างรูปภาพ (Image Generator) อื่น ๆ
การเทียบประสิทธิภาพนี้ ใช้เครื่องมือที่ชื่อว่า GenEval
อธิบายง่าย ๆ ก็คือ เครื่องมือที่พัฒนาขึ้นเพื่อประเมินความสอดคล้องระหว่างข้อความและภาพที่สร้างขึ้นโดย AI
โดยเน้นการประเมินคุณสมบัติของภาพที่ซับซ้อนกัน เช่น การปรากฏร่วมกันของวัตถุ ตำแหน่ง จำนวน และสี
ซึ่งผลการทดสอบระบุว่า
- Janus-Pro-7B ได้ 80 คะแนน
- DALL-E3 เครื่องมือสร้างรูปภาพ ของ OpenAI ได้ 67 คะแนน
และอีกเครื่องมือหนึ่งชื่อว่า DPG-Bench (Dense Prompt Graph Benchmark) ถูกพัฒนาขึ้นเพื่อประเมินความสามารถของโมเดลที่สร้างภาพจากข้อความ
โดยเน้นทดสอบว่า โมเดล AI สร้างภาพสามารถจัดการกับภาพที่มีหลายวัตถุได้หรือไม่ มีความเข้าใจในความละเอียดอ่อนและความซับซ้อนของภาพมากน้อยเพียงใด
ซึ่งผลการทดสอบระบุว่า
- Janus-Pro-7B ได้คะแนน 84.2 คะแนน
- DALL-E3 เครื่องมือสร้างรูปภาพ ของ OpenAI ได้ 83.5 คะแนน
จากทั้ง 2 ประสิทธิภาพนี้ สรุปได้ว่า Janus Pro เป็นอีกหนึ่งเครื่องมือ AI สร้างรูปภาพตัวโหดจากจีน ที่เข้ามาแข่งขันกับ OpenAI ของสหรัฐอเมริกา
อย่างไรก็ตาม ใครที่อยากทดลองใช้ Janus Pro อาจต้องรอไปก่อน
เนื่องจากในหน้าเว็บไซต์มีการชี้แจงว่า มีผู้ใช้งานเป็นจำนวนมาก ทำให้การใช้งาน Janus-Pro-7B ยังไม่สามารถใช้งานได้ในช่วงเวลานี้
นอกจากนี้ หากลองใช้งาน Janus-Pro-1B เครื่องมือสร้างรูปภาพจากชุดคำสั่ง จะพบว่า นอกจากจะต้องใช้เวลาในการรอรูปภาพนานแล้ว บางครั้งก็ทำงานสมบูรณ์ แต่บางครั้งก็ยังทำงานไม่สมบูรณ์..
 
อ้างอิง :
โฆษณา