16 ธ.ค. 2020 เวลา 16:23 • วิทยาศาสตร์ & เทคโนโลยี
เทคนิคใหม่ในการสอน AI ให้เรียนรู้โลกกว้างได้อย่างรวดเร็วกว่าที่เคย
AI AI และ AI ทุกวันนี้เราได้ยินคำนี้เข้าหูบ่อยขึ้น ๆ และเราก็กำลังอยู่กับพวกมันอย่างไม่รู้ตัว Siri, Bixby, Alexa สารพัด smart speaker แม้แต่ App ในกล้องมือถือมันยังบอกได้เลยว่ารูปที่เรากำลังถ่ายอยู่นั้นจัดอยู่ในหมวดไหน ภาพถ่ายบุคคล อาหาร หรือว่ารูปวิว
ม้า+แรด=ยูนิคอร์น??
Ai กับความสามารถในการอ่านตัวเลขหรือตัวอักษรที่เขียนด้วยลายมือก็ทำได้แล้วในปัจจุบัน
แล้วเขาฝึกสอนเจ้าปัญญาประดิษฐ์เหล่านี้ให้เรียนรู้เรื่องราวและข้อมูลต่าง ๆ ในโลกนี้จนทำให้พวกมันมีปัญญาขึ้นมาได้อย่างไร??
หนึ่งในกลวิธีที่ใช้กันอยู่ก็คือการป้อนข้อมูลตั้งต้นจำนวนหนึ่งในเรื่องที่เราอยากให้มันเรียนรู้เข้าไป และให้มันประมวลผลเองภายใต้อัลกอลิธึมที่อาศัยการปรับแต่ง(หรือช่วยเหลือ) โดยโปรแกรมเมอร์
ซึ่งเป็นวิธีทั่วไปที่ใช้กันสำหรับ Machine Learning แต่ปริมาณข้อมูลที่ใช้ในการเรียนรู้ที่ว่าจำนวนหนึ่งนี้ไม่ใช่น้อย ๆ ถ้าจะให้ AI มีความสามารถในการเรียนรู้และสามารถแยกแยะได้อย่างถูกต้อง
อย่าง AI ด้านภาษาที่มีความสามารถในการอ่านภาษาต่าง ๆ จากภาพถ่ายที่เป็นลายมือนั้น เขาก็จะใช้ชุดตัวอย่างภาพถ่ายลายมือของตัวเลขอารบิกหลากหลายรูปแบบเพื่อเป็นข้อมูลตั้งต้น
ตัวอย่างด้านบนเป็นรูปถ่ายลายมือเลขอารบิกแบบต่าง ๆ ที่ใช้เป็นข้อมูลตั้งต้นให้กับ AI ในการเรียนรู้รูปแบบลายเส้นเพื่อที่พวกมันจะสามารถประเมินได้ว่าสิ่งที่เห็นในภาพนั้นเป็นตัวเลขอะไร โดยต้องใช้ข้อมูลภาพที่มากพอจึงจะทำให้ AI สามารถเรียนรู้และ "เดา" ลายมือที่เห็นได้ว่าเป็นเลขอะไร
ทีนี้ถ้าหากเราสังเกตและเปรียบเทียบความสามารถในการรับรู้ของ AI กับเด็กละ??
เด็กส่วนใหญ่ที่ได้รับการสอนให้รู้แล้วว่าม้ากับแรดนั้นมีหน้าตาเป็นอย่างไรจากการให้ดูรูปม้าและรูปแรดอย่างละรูป จะสามารถจินตนาการและเดาได้ไม่ยากว่าสัตว์ในเทพนิยายที่ปรากฏอยู่บนหน้าปกหนังสือนิทานที่ไม่เคยเห็นมาก่อนนั้นคือ "ม้ายูนิคอร์น" ถ้าหากเราอธิบายไปว่า "ม้ายูนิคอร์นเนี่ยมันก็เหมือนกับม้าผสมกับแรดนั่นแหละ"
หรือม้ายูนิคอร์นของ AI จะมีหน้าตาแบบนี้??
แล้ว AI นั้นจะมีความสามารถในการจินตนาการและ "เดา" ถึงสิ่งที่ไม่เคยเห็นมาก่อนจากการเรียนรู้เพียงน้อยนิดเมื่อเทียบกับเด็กน้อยได้หรือไม่?
ล่าสุดได้มีบทความของมหาวิทยาลัยวอเตอร์ลูในออนแทรีโอ ได้พูดถึงกระบวนการเรียนรู้ของ AI รูปแบบใหม่ที่ทีมนักวิจัยเรียกว่า “less than one”-shot หรือกระบวนการเรียนรู้แบบ LO-shot กระบวนการเรียนรู้ที่ AI สามารถแยกแยะและบ่งชี้สิ่งที่เห็นได้อย่างถูกต้องและแม่นยำจากการเรียนรู้ด้วยข้อมูลภาพแค่เพียงภาพเดียว
จากรูปลายมือตัวเลขที่ยกตัวอย่างมาก่อนหน้านี้ ในการสอนให้ AI เรียนรู้การอ่านลายมือได้แม่นยำ ใช้แค่รูปนั้นรูปเดียวไม่พอฐานข้อมูลที่จะฝึก AI ให้แยกแยะและอ่านตัวเลขลายมือได้อย่างแม่นยำนั้นโดยทั่วไปต้องใช้ฐานข้อมูลที่เรียกว่า MNIST ซึ่งประกอบด้วยรูปลายมือของเลข 0-9 กว่า 60,000 รูป
แต่ทีมนักวิจัยจากสถาบันเทคโนโลยีแมสซาชูเซตส์ (MIT) ก็ได้คิดค้นวิธีในการ บีบอัดข้อมูลภาพ 60,000 รูปให้เหลือแค่ 10 รูป โดยข้อมูลรูป 10 รูปที่ใช้นั้นไม่ได้คัดเลือกมาจาก 60,000 รูปใน MNIST หากแต่เป็นรูปที่ทำขึ้นมาใหม่อย่างพิถีพิถัน
รูปที่ทีมนักวิจัยจาก MIT ใช้สอน AI ในการอ่านลายมือเลขอารบิก
โดยในรูปที่ดูยึกยือไม่รู้เรื่องนี้แต่ละรูปจะถูก Tag ข้อมูลที่เรียกว่า Soft label เอาไว้ ซึ่งข้อมูลที่ว่านี้ใช้ในการบอกว่ารูปนี้มีความเหมือนกับตัวเลขต่าง ๆ กี่เปอร์เซ็นต์แทนที่จะบอกว่ารูปนี้คือเลขอะไร
อย่างเช่น เลข 3 เขียนหวัด ๆ คุณคิดว่าเราจะมองเป็นเลขอะไรได้อีก ก็น่าจะเป็นเลข 8 ใช่ไหมครับ คงไม่มีใครคิดว่าเป็นเลข 7 แน่ ๆ
ถ้าอย่างนั้นเราก็บอกว่าเลข 3 เขียนหวัด ๆ ที่เห็นอยู่มีโอกาสที่จะเป็นเลข 3 ซัก 70% เลข 8 ซัก 30% แทนละ?
1
ซึ่งนี่ก็คือหลักการใส่ข้อมูล Soft label เอาไว้ในรูปทั้ง 10 นี้ เพื่อที่จะสอน AI ให้เรียนรู้ที่จะอ่านลายมือเลขอารบิกให้ได้ผลที่ใกล้เคียงกับการเรียนรู้จากฐานข้อมูล MNIST กว่า 60,000 รูป
เมื่อทีมวิจัยประสบความสำเร็จในการใช้ข้อมูลภาพเพียง 10 รูปในการฝึก AI ให้อ่านลายมือเลขอารบิกได้อย่ามีประสิทธิภาพเท่าที่เรียนจากฐานข้อมูล MNIST
คำถามต่อไปก็คือ ถ้าจะลดให้เหลือรูปเดียวละ จะทำได้ไหม มีขีดจำกัดของการจัดทำฐานข้อมูลด้วยเทคนิคนี้หรือไม่?
และดูเหมือนว่าคำตอบคือ "ไม่มีลิมิต" รูปเพียงรูปเดียวก็ใช้สอน AI ให้เรียนรู้ได้เท่ากับข้อมูล 60,000 รูปได้ ถ้าเราสร้างฐานข้อมูลให้ได้ดีพอ
จากรูปด้านบนคือผลของการฝึก AI ให้มีความสามารถในการสร้างรูปได้อย่างหลากหลายจากข้อมูล Input ที่ใส่เข้าไปอย่างง่าย ๆ ซึ่งก็คือรูปวงกลมที่มีการแบ่งเป็นชิ้นเค้กสีต่าง ๆ กัน (รูปวงกลมเล็ก ๆ ที่อยู่ด้านขวามือคือข้อมูลที่ AI เรียนรู้และนำมาผสมสร้างเป็นรูปแต่ละรูปที่เราเห็น)
แน่นอนว่าเทคนิคนี้หากนำมาใช้ดี ๆ ย่อมเป็นการเบิกทางสู่การพัฒนา AI อย่างก้าวกระโดด เพราะไม่ต้องเสียเวลาประมวลผลข้อมูลปริมาณมหาศาลเพื่อให้ AI แต่ละตัวมีความสามารถอย่างที่ต้องการ
ปัจจุบันเราได้เห็นความน่าทึ่งของ AI มามากมายแล้ว ไม่ว่าจะเป็น AI เล่นหมากรุก AI เล่นโกะที่มนุษย์ไม่มีวันจะเอาชนะได้อีกแล้ว หรือ AI ในการสร้างภาพหรือวีดีโอปลอมอย่าง Deep Fake และ AI ก็เริ่มถูกนำมาใช้ในเกือบทุกวงการ แฝงตัวอยู่ในอุปกรณ์ต่าง ๆ ที่อยู่รอบตัวเรา แม้แต่หม้อหุงข้าวไฟฟ้าก็ยังมี AI
แต่ AI ในปัจจุบันก็ยังไม่มีความยืดหยุ่นพอที่จะเรียนรู้สิ่งใหม่ ๆ ได้รอบด้านเหมือนอย่างมนุษย์เรา การจะสอนให้ Alpha Go มาทำวีดีโอปลอมได้เก่งเท่า Deep Fake ก็ต้องใช้เวลา Setup และฝึกสอนกันใหม่ซึ่งก็ต้องใช้เวลา
แต่ด้วยเทคนิคการเรียนรู้แบบใหม่นี้เราอาจจะได้เห็น AI ที่สามารถปรับเปลี่ยนไปเรียนรู้ในสิ่งใหม่ ๆ ได้อย่างรวดเร็วในเวลาเพียงชั่วข้ามคืนก็เป็นได้

ดูเพิ่มเติมในซีรีส์

โฆษณา