เมื่อใช้ AI ติดตามการเคลื่อนไหวของมนุษย์แบบ Real Time
การทำให้คอมพิวเตอร์มองเห็นเหมือนมนุษย์
เรียกว่าคอมพิวเตอร์วิชั่น ชื่อภาษาอังกฤษ "Computer vision"
แล้วหนึ่งในความสามารถของคอมพิวเตอร์วิชั่น
ก็คือ Pose estimate
แปลเป็นไทย "ประมาณการณ์ท่วงท่า (ของมนุษย์)"
.
หมายถึงเราสามารถติดตามบุคคลในรูปได้
ไม่ใช่แค่รู้จักคนในรูปเท่านั้น
แต่ยังตรวจจับการเคลื่อนไหวทางท่าของมนุษย์
ทั้งในรูปภาพ หรือจะเป็นวีดีโอก็ย่อมได้
.
โดยใช้ปัญญาประดิษฐ์หรือ AI
มาตรวจจับ จุดต่างๆ (keypoint) ตามร่างกายคน
ตั้งแต่หู ตา จมูก คอ มือ แขน ขา เท้า สามารถรู้หมด
.
มันสามารถตรวจจับได้ทั้งรูปภาพ วีดีโอ
หรือจะเว็บแคมแบบเรียลไทม์ก็ได้นะ
หรือจะตรวจจับบุคคลได้หลายๆ คน ในคราวเดียวกันเลย
.
ส่วนคลิปที่เห็น ผมเอาไฟล์วีดีโอมาตรวจจับ
จริงๆ สิ่งที่ AI หรือคอมพิวเตอร์เห็นจากภาพเคลื่อนไหว
มันเห็นเป็นตัวเลข ไม่ใช่เห็นภาพแบบคนเห็น
.
แล้ว AI มองเห็นปุ๊บ
ก็จะให้คำตอบเป็นตัวเลขออกมา
ตัวเลขนี้จะบอกตำแหน่งๆ ต่างในภาพที่ตรวจจับได้ ว่าอยู่ตรงไหน
ที่เห็นในคลิปต้องมาทำเพิ่มเพื่อ
.
วาดรูปลากเส้นเชื่อมเองเพิ่มเติม (visualization)
จะได้เข้าใจสิ่งที่ AI มองเห็น
ส่วนเสียงผมได้ตัดต่อเพิ่มเข้าไปเพื่ออรรถรส ในการชม
(จริงๆ สามารถตรวจจับผ่านกล้องวีดีโอแบบเรียลไทม์ได้ครับ อันนี้ทำกับคลิปวีดีโอ)