29 ก.ย. 2019 เวลา 09:46 • วิทยาศาสตร์ & เทคโนโลยี
ทำไมหนอ AI ถึงสามารถเรียนรู้เรื่องต่าง ๆ ได้เอง (Partสุดท้าย) 😊
จากสองตอนก่อนหน้าทั้ง Neural Network กับ Genetic Algorithm นั้นจะเห็นได้ว่า เราแค่ออกแบบวิธีให้งู AI สามารถออกไปเรียนรู้ที่จะเอาชีวิตรอดแค่นั้นเอง
ไม่ได้ไปสอน ไปใส่ข้อมูลอะไรเลย แค่เพียงแต่ละ Node ใน network นั้นใส่เงื่อนไขของเกมส์เอาไว้ให้ครบ สุดท้ายจะเกิดรูปแบบการเล่นของ AI งูที่จะเอาชนะเกมส์ขึ้นมาได้เอง
Cr: Getty Creative
ตอนนี้เรามาดูผลกัน
สนามแรก ขนาดสนาม 10x10 ช่อง งูทุกตัวเริ่มที่ความยาว 3 ช่อง หากเดินครบ 100 ช่องแล้วยังไม่ได้กินแอปเปิล = ตาย!!
โดยแต่ละรุ่นจะประกอบด้วยประชากรงู 500 ตัว
วิธีดูคะแนนความก้าวหน้าตามรูปด้านบนนะครับ
แน่นอน รุ่นแรก วิ่งกันมั่วซั่ว ไปได้ไม่กี่ก้าวก็ชนกำแพงตาย
บางตัว งงชีวิตเห็นแอปเปิลอยู่ตรงหน้า แต่ทำอะไรไม่ถูกเดินวนเป็นวงกลมจนตาย
ในแต่ละรุ่นของ AI งูจะยังไม่มีการวิวัฒนาการ จนกว่าจะตายหมดจบรุ่น แล้วค่อยวิวัฒน์ในรุ่นถัดไป
ให้เดาว่ารุ่นแรกทำคะแนนสูงสุดได้เท่าไหร่??
(คะแนนสูงสุดคือ 97)
ตำตอบคือ 1 แต้ม จ้า
รุ่นแรก ๆ สาเหตุการตายหลักคืองูจะรีบวิ่งเข้างับแอปเปิลแล้วก็ชนกำแพงตาย
ประมาณรุ่น 60+ งูเริ่มเรียนรู้แล้วว่ากำแพงนั้นทำให้ตายได้
รุ่น 300+ เริ่มมีรูปแบบการเดินหลบกำแพง แต่กำแพงก็ยังคงเป็นสาเหตุการตายอันดับหนึ่งของงูอยู่ดี
500+ งูเริ่มเรียนรู้แล้วว่า อย่าตะกละ เน้นหลบกำแพงก่อน กินแอปเปิลไว้ทีหลังได้
750: งู AI รุ่นนี้ ปรับพฤติกรรมจนสามารถทำคะแนนได้ถึง 68 แต้มแล้ว
สู้ต่อไปเจ้างูน้อย !!
ตัวที่ 1 ของรุ่น 1453 ภารกิจสำเร็จ!!
ฟลุคหรือเปล่า??
ไม่ใช่เลยจ้า ถ้าดูในวีดีโอจะรู้ รูปแบบการเดินเลาะขอบแล้วค่อย ๆ เลื้อยสลับขึ้นลง ระวังไม่ให้กินตัวเองเดินไล่ช่องไปเรื่อย ๆ แอปเปิลก็จะมาเข้าปากเราเอง
ผมมีเพื่อนเซียนเกมส์งูที่เล่นจนจบ วิธีเล่นก็แบบเดียวกันเลย เหมือนนั่งดูเพื่อนมันเล่นยังไงยังงั้น
ย้อนกลับไป Part แรก จำได้มั้ยครับ มีประเด็นว่าถ้าเรากำหนดรูปแบบการมองของงูต่างกัน (มองเป็นระยะห่างกับมองเป็นเงื่อนไข มีหรือไม่มี)
ผลที่ได้พบว่าการกำหนดแบบเห็นระยะห่าง งูจะเรียนรู้ได้ช้ากว่าพอสมควร
ซึ่งงูทั้ง 2 กลุ่มนี้ เริ่มจากศูนย์เหมือนกัน
** เปลี่ยนกติกาให้โหดขึ้น **
จากตาราง 10x10 เพิ่มเป็น 50x50!!
เอางูที่จบการศึกษา มาปล่อยสนามใหญ่ต่อซิจะรอดมั้ย?
ผลคือ แค่เพียงในรุ่นที่ 8 เท่านั้น ก็เกิด Pattern การเดินที่ชัดเจน นี่มันเซียนเกมส์งูของจริง!!
ใช้เวลา 10 ชั่วโมง 50 นาที ในการกินแอปเปิล 2497 ลูก ขอชาบู งู AI 😁
และนี่ก็คือผลสรุปการเรียนรู้โดยเริ่มจากศูนย์ของ AI เซียนเกมส์งู
จะเห็นได้ว่าเราไม่ได้เอาข้อมูลอะไรไปใส่ให้มันเลย แค่มันเรียนรู้และปรับจูน Weights หรือก็คือข้อมูลโครโมโซมส่งต่อไปยังรุ่นลูก หลาน จนกลายเป็น AI ยอดเซียนเกมส์งูในที่สุด
ด้วยแนวคิดที่เลียนแบบธรรมชาติ วิธีการที่มนุษย์เราวิวัฒน์กันจนได้มาครองโลก และเรากำลังนำไปใช้กับปัญญาประดิษฐ์ ทำให้สามารถวิวัฒน์สู่การเรียนรู้เองอย่างแท้จริง
และด้วยกำลังการประมวลผล การเชื่อมโยงสอดประสานของแต่ละ Network การเรียนรู้ได้ตลอดทั้งวันทั้งคืน AI จึงมีศํกยภาพมหาศาล
แล้วคุณละคิดว่า AI จะก้าวล้ำแซงเราไปได้หรือไม่?? 😔 👀
Source:
เครดิตภาพ: Cap จากวีดีโอใน youtube/chrispresso

ดูเพิ่มเติมในซีรีส์

โฆษณา