31 ต.ค. 2022 เวลา 05:30 • ธุรกิจ
วันนี้ AI GEN จะพาทุกท่านมาหาวิธีการเตรียมพร้อมรับมือกับความไม่เพอร์เฟคของ AI เพื่อให้การนำเทคโนโลยี AI มาใช้งานกับธุรกิจเกิดประโยชน์สูงสุด เพราะ AI เองนั่นก็เหมือนกับมนุษย์ที่ต้องมีการเรียนรู้อยู่อย่างต่อเนื่อง ในขณะเดียวกันธุรกิจก็สามารถหาวิธี หรือกระบวนการที่จะรับมือกับข้อจำกัดบางอย่างของ AI ได้เช่นกัน เพื่อให้การนำ AI มาใช้งานสามารถตอบโจทย์การทำงานของธุรกิจได้มากที่สุด
1. Data integrity ความสมบูรณ์และถูกต้องของข้อมูล
การทำงานของ AI ประกอบไปด้วยส่วนที่สำคัญ 2 ส่วน ได้แก่ โมเดล และข้อมูล ซึ่งโมเดล AI จะสามารถทำงานได้ดีก็ต่อเมื่อมี Data หรือข้อมูลที่ดีที่สามารถใช้ในการเทรน AI ได้ ทำให้โมเดลเรียนรู้ และทำงานได้ดีต่อไป โดยที่ถ้าเราใส่ข้อมูลที่ไม่มีคุณภาพ โมเดลที่ได้ออกมาก็จะไม่ดี ทำให้ไม่สามารถนำไปใช้ประโยชน์ทางธุรกิจต่อได้ หรือถ้า Data ไม่ดี แต่โมเดลออกมาดี สิ่งที่ได้ออกมาก็ไม่สามารถนำไปใช้ประโยชน์ได้เช่นกัน
หรือถ้าโมเดล Architecture ดีมากแต่ Data ไม่ดี โมเดลก็ทำงานได้ไม่ดี เปรียบได้กับคนที่มีความสามารถแต่ถูกสอนมาแบบผิดๆ นั่นเอง ซึ่งจำเป็นที่จะต้องมีทั้งโมเดล และข้อมูลที่ดีถึงจะเป็นประโยชน์ที่สามารถนำไปใช้งานต่อได้
2. การกำหนดระดับ Confidence interval
AI เปรียบได้กับคนที่ไม่ว่าจะเทรนมามากแค่ไหน หรือต่อให้มี Accuracy rate 99% ก็มีโอกาสผิดพลาดได้อีก 1% นี้ได้เช่นกัน หรืออาจกล่าวได้ว่า AI ไม่ได้เพอร์เฟคเหมือนกับคนนั่นเอง แต่สิ่งที่ AI สามารถทำได้ดีกว่าคนคือ AI สามารถทำงานได้ 24 ชั่วโมง ตลอด 7 วันโดยไม่ต้องหยุดพัก
ส่วนใหญ่ในความเป็นจริงโมเดล AI จะทำได้ในระดับภาพตรงกลาง แล้วเราจะมีวิธีทำกับส่วนที่เป็น Over labeling area ได้อย่างไรบ้าง?
· การใช้ Confidence score เช่น ความมั่นใจสูงกว่า 90% อาจจะโอเค ต่ำกว่า 90% อาจจะต้องอาศัยคนเข้าไปตรวจสอบ มีประโยชน์แต่ต้องใช้อย่างระมัดระวัง อย่างไรก็ตาม confidence interval จะกันได้บางส่วน เช่น จุด A ที่จริงๆ เป็น class A แต่อยู่ปลายๆ distribution confidence level อาจจะต่ำทำให้เรากรองออกง่าย แต่บางครั้งโมเดลอาจจะให้ค่า confidence สูง เช่น จุด B ที่จริงๆ แล้วเป็น class B แต่ว่าไปคล้าย A มากถึงกับให้ค่า confidence score ที่สูงก็สามารถเกิดขึ้นได้
แปลว่าการใช้ confidence score ก็สามารถป้องกันได้เพียงส่วนหนึ่งเท่านั้นในการใช้งานจริง
· ให้คนตรวจสอบ โดยสุ่ม Audit หรือตัดจาก Confidence score
แต่ในหลายๆ ครั้ง AI มั่นใจว่าถูกแต่จริงๆ ผิด ถ้าธุรกิจ หรือองค์กรหวังว่าจะให้เกิดขั้นตอนการทำงานแบบอัตโนมัติ หรือระบบ Automation เราต้องวาง mechanism ในการรองรับความผิดพลาด หรือความเสียหายเหล่านี้ได้ เช่น การปล่อยสินเชื่อของสถาบันการเงิน ถ้า AI ตัดสินใจผิด และความเสียหายในระดับนี้ธุรกิจรับได้หรือไม่ แปลว่าเรายอมรับว่า AI สามารถที่จะตัดสินใจผิดได้ ถ้าเสียหายหรือผิดพลาด ก็เป็นสิ่งที่ธุรกิจสามารถยอมรับได้ เป็นต้น
3. เก็บข้อมูลเพิ่มเติมเพื่อลด Bias
ในเรื่องของจุดอ่อนในเรื่องของ Bias หรืออคตินั้น บางโมเดลอาจสามารถทำงานได้ดีในบางคลาสขึ้นอยู่กับว่ามีการเทรน Dataset มาอย่างไร ตัวอย่างเช่น ในแวดวงธุรกิจ Healthcare เช่น การตรวจดูภาพสมอง x-ray สมอง ปอด โรคที่เกิดขึ้นบ่อยๆ AI ก็จะทำงานกับโรคบางอย่างได้ดี
ตัวอย่าง Survivor Bias สำหรับ AI และ Machine learning ได้แก่
Disease Prediction : โรคบางโรคที่เราสังเกตอาจเป็นกรณีรอดชีวิต แต่ไม่ได้สังเกตคนที่ไม่ได้รอดชีวิต หากไม่นำ Input data เหล่านั้นมาพิจารณา Model ก็จะไม่สมบูรณ์
Fraud Prevention (กรณีเกิดความผิดปกติ การตรวจจับการทุจริต) : ส่วนใหญ่ข้อมูลที่นำมาเทรน และโดนจับได้ว่าเป็นการทุจริต เราก็จะโฟกัสแค่ส่วนนั้น ไม่ได้พิจารณาถึงส่วนอื่นก็จะเป็น Survivor bias ในทาง AI และ Machine learning
ในส่วนของวิธีแก้ไขปัญหาเรื่อง Survivor bias นั้น ทำได้ดังต่อไปนี้
· การรับรู้ว่าปัญหานี้สามารถเกิดขึ้นได้
· หลังจากนั้นให้เก็บข้อมูลเพิ่มเติม เพื่อป้องกันเรื่อง Bias เช่น เทรนรูปภาพคนผิวสีให้มากขึ้น เพื่อให้ Balance คนผิวขาวที่มากกว่าใน data set เพื่อให้ treat data ได้แฟร์มากขึ้น
· ปรับแต่งค่าพารามิเตอร์ของการเทรน AI
· ใช้โมเดลที่ทำให้เราเข้าใจว่าเกิดอะไรขึ้นในโมเดล เพื่อทำให้ผู้พัฒนสามารถจับ Bias ได้
4. ใช้กระบวนการในการตรวจสอบ และดำเนินการอย่างรวดเร็ว
Ethical AI เป็นเรื่องของการนำ AI ไปใช้งานจริงว่าเหมาะสม หรือไม่เหมาะสมอย่างไรกับการใช้ชีวิตของมนุษย์ ไม่มีใครสงสัยในศักยภาพของปัญญาประดิษฐ์ แต่บางคนอาจจะสงสัยว่า AI นั้นจะถูกนำมาใช้ในทางที่ดีหรือไม่ดี
ตัวอย่างแรก คือการเหยียดผิว ซึ่งหลายครั้งถ้าเราเอาตาม data เลยอาจจะเกิดเหตุการณ์ที่ว่าพอเรามีเก็บข้อมูลของคนที่กระทำความผิดมาซึ่งเป็นคนผิวสีมากกว่าคนผิวขาว พอครั้งต่อมาพอ AI ใช้ข้อมูลเหล่านี้ในการคาดการณ์ก็จะทำให้เกิด Bias หรืออคติที่ทำให้เกิด Ethical issue ที่โน้มเอนซึ่งในแง่ของการใช้งานจริงก็ไม่เหมาะสม ถ้าคนผิวสีเป็นคนดีแต่กลับเจอระบบที่ไม่แฟร์ ก็จะมีปัญหาเกิดขึ้นซึ่งในแง่ของการใช้งานจริงก็ไม่เหมาะสม ถ้าคนผิวสีเป็นคนดีแต่กลับเจอระบบที่ไม่แฟร์ ก็จะมีปัญหาเกิดขึ้น
หรือตัวอย่างเรื่องการสมัครงาน เช่น การเทรนข้อมูลของ AI ในบางตำแหน่งของธุรกิจอาจจะมีข้อมูลที่บ่งบอกว่าคนที่เป็นผู้จัดการส่วนใหญ่เป็นผู้ชาย พอเป็นแบบนี้ครั้งต่อไป AI ก็จะคาดการณ์ความโน้มเอียงโดยเลือกผู้ชายให้เข้าไปอยู่ในตำแหน่งที่เป็น Manager ทั้งที่จริงแล้วไม่ได้เป็นการตัดสินว่าผู้หญิงหรือผู้ชายทำงานนี้ได้ดีกว่ากัน เพียงแต่ข้อมูลที่ผ่านมามีลักษณะเป็นอย่างนั้นทำให้เกิดความโน้มเอียง และการปฏิเสธที่ไม่แฟร์ได้
แล้วเราจะมีวิธีป้องกันเรื่อง Ethical AI ได้อย่างไร?
· เข้าใจว่า AI เป็นแค่อัลกอริทึมที่เรียนรู้มาจาก Data สอนอย่างไรได้ผลออกมาอย่างนั้น
· สิ่งที่ธุรกิจควรทำคือมีการติดตาม และ Action อย่างรวดเร็ว ถ้าหากเกิดอะไรที่ไม่เหมาะสม อาจจะต้องใช้คน หรือระบบการติดตาม
· กระบวนการหลังประมวลผลคำตอบ : มีระบบในการตรวจจับ และกรองส่วนที่ไม่เหมาะสมออกไป
· ปรับจูนการเทรนอัลกอริทึมให้เหมาะสม
· จัดระเบียบข้อมูล ถ้าข้อมูลไม่ดี ควรกรองออกไปตั้งแต่แรกก่อนทำการเทรน
5. การฝึกโมเดลใหม่โดยคำนึงถึง Model drift
Model Drifts เป็นเรื่องของโมเดล Performance ที่เทรนมาเปลี่ยนแปลงไปตามกาลเวลา ซี่งการ Drift ก็มีหลายชนิด ได้แก่
· Concept drift : ธรรมชาติของกฎ และการเกิดขึ้นของข้อมูลเปลี่ยนแปลงไป เช่น คำนิยามของสุนัข และแมวเปลี่ยนไป สุนัขพันธุ์ใหม่คล้ายแมวมาก จะทำให้โมเดลที่เราเทรนใช้งานได้ไม่ดีเหมือนเดิม
· Data drift : โมเดลอาจจะใช้งานได้ดี แต่มีการเปลี่ยนแปลงตามฤดูกาล หรือเทรนด์เปลี่ยน เช่น โมเดลก่อนหน้านี้ของลูกค้า คนสนใจไอโฟน มากกว่าซัมซุง แต่ตอนนี้ซัมซุงได้รับความนิยมมากขึ้น ก็ทำให้โมเดลใช้งานได้ไม่ดีอีกต่อไป
· Upstream data changes : ข้อมูลก่อนเข้าโมเดลมีการเปลี่ยนแปลง อย่างเช่น การ encoding เปลี่ยน Format จากเดิม หรือการคลีนข้อมูลที่เปลี่ยนไป
สิ่งที่เราควรทำคือตรวจจับ หรือ Detect ให้ได้ก่อน ตรวจดูการ Label และสังเกตการเปลี่ยนแปลง หรือดูผลการคาดการณ์จาก distribution ดู Outliner หากมีมากขึ้นแปลว่าโมเดลทำงานได้แย่ลง ต้องเทรนใหม่เพื่อให้ความแม่นยำเพิ่มขึ้น และฝึกโมเดลใหม่โดยคำนึงถึง Model drift อยู่เสมอ
6. โฟกัสในการใช้ข้อมูลที่เป็นระบบ (Data-centric AI)
จุดอ่อนอีกข้อของ AI โดยเฉพาะ Deep Learning คือการต้องใช้จำนวนข้อมูลมหาศาลในการสอนให้ AI ฉลาด และสามารถทำงานได้ดี ถ้าเราเริ่มจากโมเดลที่ไม่เคยเทรนก็จะทำให้ AI ไม่สามารถทำงานได้ดีได้ หากเรามี data set ค่อนข้างน้อย
ตัวอย่างเช่น จุดอ่อนอันนึงที่เทียบได้กับเด็ก 4 ขวบ คือ เด็ก 4 ขวบเห็นตัวอย่างไม่กี่ตัวอย่างก็รู้ว่าอันนี้คือ สุนัข หรือแมว แต่ Deep Learning นั้นต้องใช้ตัวอย่างเป็นพันๆ กว่าจะได้ AI ที่สามารถตัดสินได้ดี
และอุปสรรคที่สำคัญของหลายธุรกิจคือ ไม่มีข้อมูล และไม่เคยเก็บข้อมูล เก็บยาก มีค่าใช้จ่าย เช่น แรงงานคน เวลาในการทำ Equipment storage อีกหลายอย่างที่เกี่ยวข้องกับข้อมูล ซึ่งสามารถมีวิธีการรับมือ หรือแก้ไขปัญหาได้ดังต่อไปนี้
· Data-centric AI : ต้องโฟกัสข้อมูลเป็นระบบ เทรนให้สำเร็จด้วยข้อมูลที่น้อยลง
· เริ่มจากโมเดลที่มีคนเทรนจากข้อมูลมหาศาลก่อนหน้านี้ได้ เช่น Image recognition, Image segmentation และ Natural Language understanding
· พัฒนาคุณภาพของการทำ Data labeling ให้มีความสม่ำเสมอมากขึ้น
· Synthetic data โดยการใช้ Code generate data เช่น Self driving car
· Data augmentation ตัวอย่างเช่น เรามีรูปสุนัขรูปเดียว แต่สามารถ · Augmentation ปรับภาพได้หลายแบบ ทำให้ AI ฉลาดมากขึ้น Recognize ให้ AI ทำงานได้ดี
Think AI Think AI GEN
อ่านบทความฉบับเต็มได้ที่ลิงค์ : https://bit.ly/3ea1veT
ผู้ที่สนใจเกี่ยวกับการนำโซลูชัน AI ไปใช้เพื่อเพิ่มขีดความสามารถให้กับธุรกิจ
สามารถดูข้อมูลเพิ่มเติมเกี่ยวกับ AI GEN ได้ที่
· Facebook : AI GEN : ไอเจ็น
· Line : @aigen
โฆษณา