วันนี้ AI GEN จะพาทุกท่านมาหาวิธีการเตรียมพร้อมรับมือกับความไม่เพอร์เฟคของ AI เพื่อให้การนำเทคโนโลยี AI มาใช้งานกับธุรกิจเกิดประโยชน์สูงสุด เพราะ AI เองนั่นก็เหมือนกับมนุษย์ที่ต้องมีการเรียนรู้อยู่อย่างต่อเนื่อง ในขณะเดียวกันธุรกิจก็สามารถหาวิธี หรือกระบวนการที่จะรับมือกับข้อจำกัดบางอย่างของ AI ได้เช่นกัน เพื่อให้การนำ AI มาใช้งานสามารถตอบโจทย์การทำงานของธุรกิจได้มากที่สุด
1. Data integrity ความสมบูรณ์และถูกต้องของข้อมูล
การทำงานของ AI ประกอบไปด้วยส่วนที่สำคัญ 2 ส่วน ได้แก่ โมเดล และข้อมูล ซึ่งโมเดล AI จะสามารถทำงานได้ดีก็ต่อเมื่อมี Data หรือข้อมูลที่ดีที่สามารถใช้ในการเทรน AI ได้ ทำให้โมเดลเรียนรู้ และทำงานได้ดีต่อไป โดยที่ถ้าเราใส่ข้อมูลที่ไม่มีคุณภาพ โมเดลที่ได้ออกมาก็จะไม่ดี ทำให้ไม่สามารถนำไปใช้ประโยชน์ทางธุรกิจต่อได้ หรือถ้า Data ไม่ดี แต่โมเดลออกมาดี สิ่งที่ได้ออกมาก็ไม่สามารถนำไปใช้ประโยชน์ได้เช่นกัน
หรือถ้าโมเดล Architecture ดีมากแต่ Data ไม่ดี โมเดลก็ทำงานได้ไม่ดี เปรียบได้กับคนที่มีความสามารถแต่ถูกสอนมาแบบผิดๆ นั่นเอง ซึ่งจำเป็นที่จะต้องมีทั้งโมเดล และข้อมูลที่ดีถึงจะเป็นประโยชน์ที่สามารถนำไปใช้งานต่อได้
2. การกำหนดระดับ Confidence interval
AI เปรียบได้กับคนที่ไม่ว่าจะเทรนมามากแค่ไหน หรือต่อให้มี Accuracy rate 99% ก็มีโอกาสผิดพลาดได้อีก 1% นี้ได้เช่นกัน หรืออาจกล่าวได้ว่า AI ไม่ได้เพอร์เฟคเหมือนกับคนนั่นเอง แต่สิ่งที่ AI สามารถทำได้ดีกว่าคนคือ AI สามารถทำงานได้ 24 ชั่วโมง ตลอด 7 วันโดยไม่ต้องหยุดพัก
ส่วนใหญ่ในความเป็นจริงโมเดล AI จะทำได้ในระดับภาพตรงกลาง แล้วเราจะมีวิธีทำกับส่วนที่เป็น Over labeling area ได้อย่างไรบ้าง?
· การใช้ Confidence score เช่น ความมั่นใจสูงกว่า 90% อาจจะโอเค ต่ำกว่า 90% อาจจะต้องอาศัยคนเข้าไปตรวจสอบ มีประโยชน์แต่ต้องใช้อย่างระมัดระวัง อย่างไรก็ตาม confidence interval จะกันได้บางส่วน เช่น จุด A ที่จริงๆ เป็น class A แต่อยู่ปลายๆ distribution confidence level อาจจะต่ำทำให้เรากรองออกง่าย แต่บางครั้งโมเดลอาจจะให้ค่า confidence สูง เช่น จุด B ที่จริงๆ แล้วเป็น class B แต่ว่าไปคล้าย A มากถึงกับให้ค่า confidence score ที่สูงก็สามารถเกิดขึ้นได้
· หลังจากนั้นให้เก็บข้อมูลเพิ่มเติม เพื่อป้องกันเรื่อง Bias เช่น เทรนรูปภาพคนผิวสีให้มากขึ้น เพื่อให้ Balance คนผิวขาวที่มากกว่าใน data set เพื่อให้ treat data ได้แฟร์มากขึ้น
Ethical AI เป็นเรื่องของการนำ AI ไปใช้งานจริงว่าเหมาะสม หรือไม่เหมาะสมอย่างไรกับการใช้ชีวิตของมนุษย์ ไม่มีใครสงสัยในศักยภาพของปัญญาประดิษฐ์ แต่บางคนอาจจะสงสัยว่า AI นั้นจะถูกนำมาใช้ในทางที่ดีหรือไม่ดี
ตัวอย่างแรก คือการเหยียดผิว ซึ่งหลายครั้งถ้าเราเอาตาม data เลยอาจจะเกิดเหตุการณ์ที่ว่าพอเรามีเก็บข้อมูลของคนที่กระทำความผิดมาซึ่งเป็นคนผิวสีมากกว่าคนผิวขาว พอครั้งต่อมาพอ AI ใช้ข้อมูลเหล่านี้ในการคาดการณ์ก็จะทำให้เกิด Bias หรืออคติที่ทำให้เกิด Ethical issue ที่โน้มเอนซึ่งในแง่ของการใช้งานจริงก็ไม่เหมาะสม ถ้าคนผิวสีเป็นคนดีแต่กลับเจอระบบที่ไม่แฟร์ ก็จะมีปัญหาเกิดขึ้นซึ่งในแง่ของการใช้งานจริงก็ไม่เหมาะสม ถ้าคนผิวสีเป็นคนดีแต่กลับเจอระบบที่ไม่แฟร์ ก็จะมีปัญหาเกิดขึ้น
หรือตัวอย่างเรื่องการสมัครงาน เช่น การเทรนข้อมูลของ AI ในบางตำแหน่งของธุรกิจอาจจะมีข้อมูลที่บ่งบอกว่าคนที่เป็นผู้จัดการส่วนใหญ่เป็นผู้ชาย พอเป็นแบบนี้ครั้งต่อไป AI ก็จะคาดการณ์ความโน้มเอียงโดยเลือกผู้ชายให้เข้าไปอยู่ในตำแหน่งที่เป็น Manager ทั้งที่จริงแล้วไม่ได้เป็นการตัดสินว่าผู้หญิงหรือผู้ชายทำงานนี้ได้ดีกว่ากัน เพียงแต่ข้อมูลที่ผ่านมามีลักษณะเป็นอย่างนั้นทำให้เกิดความโน้มเอียง และการปฏิเสธที่ไม่แฟร์ได้
แล้วเราจะมีวิธีป้องกันเรื่อง Ethical AI ได้อย่างไร?
· เข้าใจว่า AI เป็นแค่อัลกอริทึมที่เรียนรู้มาจาก Data สอนอย่างไรได้ผลออกมาอย่างนั้น
จุดอ่อนอีกข้อของ AI โดยเฉพาะ Deep Learning คือการต้องใช้จำนวนข้อมูลมหาศาลในการสอนให้ AI ฉลาด และสามารถทำงานได้ดี ถ้าเราเริ่มจากโมเดลที่ไม่เคยเทรนก็จะทำให้ AI ไม่สามารถทำงานได้ดีได้ หากเรามี data set ค่อนข้างน้อย
ตัวอย่างเช่น จุดอ่อนอันนึงที่เทียบได้กับเด็ก 4 ขวบ คือ เด็ก 4 ขวบเห็นตัวอย่างไม่กี่ตัวอย่างก็รู้ว่าอันนี้คือ สุนัข หรือแมว แต่ Deep Learning นั้นต้องใช้ตัวอย่างเป็นพันๆ กว่าจะได้ AI ที่สามารถตัดสินได้ดี