Blockdit Logo
Blockdit Logo (Mobile)
สำรวจ
ลงทุน
คำถาม
เข้าสู่ระบบ
มีบัญชีอยู่แล้ว?
เข้าสู่ระบบ
หรือ
ลงทะเบียน
MarketThink
ยืนยันแล้ว
•
ติดตาม
19 มี.ค. เวลา 12:08 • วิทยาศาสตร์ & เทคโนโลยี
สรุปกลไก ที่ทำให้หุ่นยนต์ฮิวแมนนอยด์ ของ NVIDIA คิดและทำงานได้ แบบมนุษย์
-ที่เห็นในรูปนี้คือ “Humanoid Robots” หรือหุ่นยนต์ที่สามารถทำงานทั่ว ๆ ไปได้แบบมนุษย์ เช่น ล้างจาน ทำงานในโรงงาน
ซึ่งล่าสุด NVIDIA เพิ่งประกาศเร่งพัฒนาอย่างเป็นทางการ พร้อมเปิดตัว “GROOT N1” เป็นโมเดลพื้นฐานสำหรับหุ่นยนต์ฮิวแมนนอยด์แบบเปิด (Open Source) ตัวแรกของโลก
โดย Humanoid Robots นับว่าเป็นหนึ่งใน “Physical AI” ที่คุณเจนเซน หวง CEO ของ Nvidia บอกว่า จะเป็นอุตสาหกรรมที่ใหญ่ที่สุดในอนาคต
รวมไปถึงยังบอกว่า “ยุคของ Generalist Robotics หรือการใช้งานหุ่นยนต์ในชีวิตประจำวันทั่ว ๆ ไปอย่าง Humanoid Robot ได้มาถึงแล้ว..”
แล้ว Humanoid Robots ที่ทำงานด้วยโมเดล GROOT N1 ที่ว่านี้ น่าสนใจอย่างไร ?
MarketThink สรุปมาให้อ่านกันแบบเข้าใจง่าย ๆ
1. รู้จัก GROOT N1
หรือที่ย่อมาจาก NVIDIA Isaac GROOT N1 เป็นโมเดลพื้นฐานแบบเปิด (Open Source) ตัวแรกของโลก ที่รองรับการใช้งานกับหุ่นยนต์หลากหลายประเภท และสามารถตอบรับข้อมูลหลายรูปแบบ
ที่น่าสนใจคือ GROOT N1 เป็นโมเดลที่ออกแบบมาให้เป็นมากกว่าหุ่นยนต์ใช้แรงงานทั่ว ๆ ไป
เพราะมาพร้อมกับสถาปัตยกรรม Dual-System "Thinking Fast and Slow" ที่ทำให้หุ่นยนต์ฮิวแมนนอยด์สามารถให้เหตุผล และพัฒนาทักษะได้แบบมนุษย์ได้
โดย GROOT N1 ถูกฝึกด้วยชุดข้อมูลขนาดใหญ่เกี่ยวกับหุ่นยนต์ฮิวแมนนอยด์ และเสริมด้วยข้อมูลที่สร้างขึ้นจาก NVIDIA Isaac GROOT Blueprint
หรือก็คือ ชุดข้อมูลที่สร้างขึ้นเพื่อสอนหุ่นยนต์ในการเคลื่อนไหว และโต้ตอบกับสภาพแวดล้อมอย่างมีประสิทธิภาพ
นอกจากนี้ โมเดลยังสามารถปรับแต่งเพิ่มเติม (Post-Training) ให้เหมาะสมกับหุ่นยนต์ งาน และสภาพแวดล้อมเฉพาะได้
ปัจจุบัน ส่วนหนึ่งของข้อมูลชุดนี้ถูกเปิดให้ใช้งานฟรีสำหรับนักพัฒนา ผ่านชุดข้อมูล AI ของ NVIDIA บน Hugging Face
และล่าสุด NVIDIA ได้ประกาศเปิดตัว GROOT N1 2B เป็นโมเดลแรกที่สามารถปรับแต่งได้เต็มรูปแบบ
ซึ่งจะได้รับการฝึกล่วงหน้า และจะเปิดให้ใช้งานในอนาคตอีกด้วย
2. โครงสร้างและการทำงานของ GROOT N1
GROOT N1 ใช้สถาปัตยกรรมที่ได้รับแรงบันดาลใจจากกระบวนการคิดของมนุษย์ โดยประกอบด้วยสองส่วนที่ทำงานร่วมกัน ได้แก่
- Vision-Language Model (System 2) เป็นระบบที่ช่วยวิเคราะห์และให้เหตุผล ผ่าน NVIDIA-Eagle ทำให้หุ่นยนต์เข้าใจสภาพแวดล้อม และวางแผนการทำงานได้เหมาะสม
- Diffusion Transformer (System 1) เป็นระบบควบคุมการเคลื่อนไหวของหุ่นยนต์ เพื่อให้สามารถเคลื่อนไหวได้อย่างแม่นยำ และต่อเนื่อง
3. ขั้นตอนการฝึกข้อมูล GROOT N1 มีลักษณะเหมือนพีระมิด
อธิบายง่าย ๆ คือ
- ฐานล่างสุด เลือกใช้ข้อมูลจากเว็บขนาดใหญ่ และวิดีโอของมนุษย์ เพื่อให้ได้ข้อมูลเกี่ยวกับภาพและภาษา
โดยข้อมูลเหล่านี้ช่วยให้หุ่นยนต์เข้าใจปฏิสัมพันธ์ระหว่างมนุษย์กับวัตถุ และเรียนรู้รูปแบบการเคลื่อนไหวตามธรรมชาติ รวมถึงความหมายของแต่ละงาน
- ส่วนชั้นกลางใช้ข้อมูลสังเคราะห์ที่สร้างขึ้นโดยแพลตฟอร์ม NVIDIA Omniverse
- และจุดสูงสุดใช้ข้อมูลจากหุ่นยนต์จริง ที่รวบรวมผ่านการควบคุมระยะไกล (Teleoperation) จากหลายแพลตฟอร์ม ซึ่งให้ข้อมูลเชิงลึกเกี่ยวกับ ความสามารถของหุ่นยนต์ในการทำงานจริง
4. ผลการทดสอบจากเครื่องมือการทดสอบด้านต่าง ๆ ได้แก่
- Simulation Benchmarks ใช้เพื่อประเมินประสิทธิภาพของโมเดลที่ใช้ในการจัดการวัตถุในสภาพแวดล้อมจำลอง ประกอบไปด้วย 3 เครื่องมือ ได้แก่
RoboCasa เป็นเฟรมเวิร์กการจำลองขนาดใหญ่ ที่ออกแบบมาเพื่อฝึกหุ่นยนต์ให้สามารถปฏิบัติงานประจำวันได้หลากหลาย
DexMG เป็นชุดการทดสอบการจัดการวัตถุด้วยความชำนาญ ที่เน้นการประเมินความสามารถของหุ่นยนต์ในการหยิบจับและควบคุมวัตถุที่มีความซับซ้อน
GR-1 เป็นหุ่นยนต์ฮิวแมนนอยด์ ที่ใช้ในการทดสอบความสามารถของโมเดลในการควบคุมและปฏิบัติงานในสภาพแวดล้อมที่กำหนด
โดยการทดสอบนี้มีตัวเปรียบเทียบทั้งหมด 3 ตัว คือ BC Transformer, Diffusion Policy และ NVIDIA Isaac GROOT N1 2B
ผลการทดสอบที่ได้ พบว่า NVIDIA Isaac GR00T N1 2B เป็นโมเดลที่ให้ผลลัพธ์ดีที่สุดในทุกการทดสอบ
- Real Benchmarks ใช้หุ่นยนต์ GR-1 เพื่อประเมินประสิทธิภาพของโมเดล ที่ต้องการการจัดการวัตถุอย่างแม่นยำ การเคลื่อนไหวแบบสองมือที่ประสานกัน และความสามารถในการรับรู้เชิงพื้นที่ขั้นสูง
โดยแบ่งเป็น 4 หมวดการทดสอบหลัก ได้แก่
- Pick and Place การหยิบจับและวางวัตถุ
- Articulated การควบคุมวัตถุที่มีชิ้นส่วนเคลื่อนที่ เช่น บานพับหรือกลไก
- Industrial งานที่เกี่ยวข้องกับอุตสาหกรรม เช่น การประกอบหรือจัดการอุปกรณ์
- Coordination งานที่ต้องใช้แขนทั้งสองข้างทำงานร่วมกัน
โดยการทดสอบนี้มีตัวเปรียบเทียบทั้งหมด 2 ตัว คือ Diffusion Policy และ NVIDIA Isaac GROOT N1 2B
ผลการทดสอบที่ได้ พบว่า NVIDIA Isaac GROOT N1 2B เป็นโมเดลที่ให้ผลลัพธ์ดีที่สุดในทุกการทดสอบอีกเช่นเคย
- มาถึงตรงนี้ จะเห็นได้ว่าโลกหุ่นยนต์ในอนาคต ที่เราพบเห็นในโลกภาพยนตร์ กำลังจะเข้าใกล้ความเป็นจริง ในโลกปัจจุบันมากขึ้น
แม้ว่าปัจจุบันจะเป็นเพียงการประกาศพัฒนาหุ่นยนต์ Humanoid Robots จาก NVIDIA อย่างเป็นทางการเท่านั้น
แต่ก็หมายความว่าในอนาคตอันใกล้ เราอาจได้เห็นหุ่นยนต์มนุษย์มานั่งทำงานแทนมนุษย์จริง ๆ
อ้างอิง:
-
https://nvidianews.nvidia.com/news/nvidia-isaac-gr00t-n1-open-humanoid-robot-foundation-model-simulation-frameworks
-
https://developer.nvidia.com/blog/accelerate-generalist-humanoid-robot-development-with-nvidia-isaac-gr00t-n1/
7 บันทึก
12
7
7
12
7
โฆษณา
ดาวน์โหลดแอปพลิเคชัน
© 2025 Blockdit
เกี่ยวกับ
ช่วยเหลือ
คำถามที่พบบ่อย
นโยบายการโฆษณาและบูสต์โพสต์
นโยบายความเป็นส่วนตัว
แนวทางการใช้แบรนด์ Blockdit
Blockdit เพื่อธุรกิจ
ไทย