27 ก.พ. เวลา 06:26 • วิทยาศาสตร์ & เทคโนโลยี
มหาวิทยาลัยมหิดล

การประมาณค่าท่าทางศีรษะด้วยการเรียนรู้เชิงลึก จากรูปภาพRGB และการประยุกต์กับการวัด CROM ทางการแพทย์

โดย รศ.ดร.ปัณรสี ฤทธิประวัติ, นพ.กิตติศักดิ์ โชติกกำธร, Prof.Dr. Wen-Nung Lie รศ.ดร.วรพันธุ์ คู่สกุลนิรันดร์, พญ.พิมพ์ชนก เทือกต๊ะ และ ผศ.ดร.นพ.ไพฑูรย์ เบ็ญจพรเลิศ
Mahidol University and National Chung Cheng University
สำหรับมนุษย์ การเคลื่อนไหวของคอจะมีระดับความสามารถที่ลดลงจากอายุที่มากขึ้น จากการบาดเจ็บ ความผิดปกติของระบบกล้ามเนื้อและกระดูก หรือโรคความเสื่อม Cervical range of motion (CROM) เป็นหนึ่งในการตรวจคอเชิงปริมาณที่ได้รับความนิยม แม้ว่าการถ่ายภาพรังสีจะเป็นมาตรฐานแต่ก็ต้องเผชิญกับการได้รับรังสี และความมีราคาแพง
ในปัจจุบันวิธีการ vision-based ได้ถูกนำมาใช้กับการวัด CROM แต่กลับเกิดคฃการคลาดเคลื่อน และต้องใช้กล้องจับความลึกช่วย ในทางกลับกัน deep neural networks ให้ประสิทธิภาพที่ดีในการประมาณการ head pose estimation (HPE) จากภาพเดียวจึงมีแนวโน้มว่าจะสามารถใช้การวัด CROM ทางการแพทย์ได้
งานวิจัยนี้จึงให้ใช้ CNN networks ฟีเจอร์ extract pyramidal หรือ multi-level image ซึ่งจะถูกส่งผ่านไปยังโมดูลความสนใจข้ามระดับสำหรับ feature fusion จากนั้นไปยังโมดูล modified ASPP และโมดูล multi-bin classification/regression
สำหรับ spatial-channel attention และ Euler angle conversion/prediction ตามลำดับ
เทคนิคที่นำเสนอได้รับการประเมินบนชุดข้อมูลสาธารณะ เช่น 300W_LP, AFLW2000 และ BIWI เพื่อตรวจสอบประสิทธิภาพที่มากขึ้น (โดยมีค่าเฉลี่ย MAE = 3.50°, 3.40° และ 2.31° สำหรับโปรโตคอลการทดลองที่แตกต่างกัน) มากกว่าstate-of-the-artปัจจุบัน
แบบจำลองก่อนการฝึกยังได้ถูกประเมินด้วยชุดข้อมูลที่รวบรวมจากโรงพยาบาลสำหรับการวัด CROM นอกจากนี้ ยังบรรลุค่า MAE ต่ำสุดที่ 4.58° เมื่อเทียบกับวิธีการอื่นๆ และเป็นไปตามมาตรฐานทางการแพทย์ที่ 5° ยกเว้น pitch angle (ซึ่งมี MAE อยู่ที่ 5.70° ซึ่งใหญ่กว่ามาตรฐานและมุมเอียง (MAE = 3.60°) และ roll angles (MAE = 4.44°)) โดยทั่วไป เทคนิค HPE เป็นไปได้สำหรับการวัด CROM และแสดงให้เห็นถึงข้อดีของความเร็ว ไม่ล้วงล้ำเข้าสู่ร่างกาย ไม่ติดอุปกรณ์แสดงตำแหน่งอ้างอิงบนร่างกาย และต้นทุนการดำเนินงานต่ำ
อ่านฉบับเต็มได้ที่ DOI: https://doi.org/10.1007/s11042-024-18612-2
Abstract
For human beings, neck movement will be degraded due to aging, trauma, musculoskeletal disorders, or degenerative diseases. Cervical range of motion (CROM) measurement is one of the popular quantitative neck examinations. Despite radiography is considered as the gold standard, it suffers from invasiveness, radiation exposure, and expensiveness.
Recently, vision-based methods have been applied for CROM measurement but achieve large errors and require depth camera. On the other hand, deep neural networks provide good performances on head pose estimation (HPE) from a single image, thus promising for medical CROM measurement.
We propose to use CNN networks to extract pyramidal or multi-level image features, which are passed to cross-level attention modules for feature fusion and then to a modified ASPP module and a multi-bin classification/regression module for spatial-channel attention and Euler angle conversion/prediction, respectively.
The proposed technique was evaluated on public datasets, such as 300W_LP, AFLW2000, and BIWI, to verify its superior performances (with mean MAE = 3.50°, 3.40°, and 2.31° for different experimental protocols) than state-of-the-art methods. Our pre-trained model was also evaluated with our own collected dataset from hospital for CROM measurement.
It also achieved the lowest MAE of 4.58° among other methods and conformed with a medical standard of 5 degrees except the pitch angle (which has a MAE of 5.70°, larger than the standard and the yaw (MAE = 3.60°) and roll angles (MAE = 4.44°)). In general, HPE technique is feasible for CROM measurement and shows its advantages of speed, non-invasiveness, free of anatomical landmark and low cost of operation.
บทความโดย กิตติคุณ ทองกัญชร, คณะเทคโนโลยีสารสนเทศและการสื่อสาร มหาวิทยาลัยมหิดล
By Kittikhun Thongkanchorn, ICT Mahidol Univrtsity
โฆษณา