📌 สรุปเนื้อหาสำคัญในคอร์ส Generative AI for Everyone ที่สอนโดย Andrew Ng 📝
คอร์ส Generative AI for Everyone ใน Coursera เป็นคอร์สที่อธิบายตั้งแต่พื้นฐานเลยว่ามันทำงานยังไง คนที่ไม่มีความรู้เลยในด้าน Generative AI หรือมีความรู้แบบจำกัดจำเขี่ยแบบผมก็สามารถเรียนได้
Andrew จะสอนพื้นฐานตั้งแต่ว่า Generative AI คืออะไร มันทำอะไรได้บ้างและทำอะไรไม่ได้บ้าง อันนี้คนส่วนใหญ่อาจจะไม่รู้ข้อจำกัดของมัน
🔘 สัปดาห์ที่ 2 : Generative AI projects
จะเป็นการเล่าถึงการนำ Generative AI ไปใช้ใน project use cases ต่าง ๆ และ options ต่าง ๆ ที่มีในการเลือกใช้
🔘 สัปดาห์ที่ 3 : Generative AI in Business and Society
จะเน้นการนำ Generative AI ไปใช้ในธุรกิจและ impact ต่องานต่าง ๆ รวมไปถึงการใช้ AI อย่างรับผิดชอบและมีจริยธรรม
☝🏻 แล้ว Andrew Ng เป็นใครทำไมเราต้องเรียนกับเขา????
👉🏻 Andrew เป็นเหมือน pioneer คนแรก ๆ ที่เชี่ยวชาญเกี่ยวกับด้าน AI เขาเป็นหนึ่งใน founding member ของ Google Brain เรียกได้ว่าเป็น expert ที่รู้เรื่อง AI มากที่สุดคนหนึ่งของโลก เขายังเป็นผู้ก่อตั้งบริษัท AI Fund, DeepLearning.AI (ที่ทำคอร์สนี้) และ Coursera รวมถึงการเป็นบอร์ดบริหารให้กับ Amazon
เห็นโปรไฟล์เทพขนาดนี้แล้วรีบไปเรียนกันเลยครับ 😁
……………..
“The rise of generative AI”
Andrew เริ่มจากการโชว์ให้ดูครับว่าการ launch ตัว ChatGPT เมื่อ Q4 ปี 2022 นั้นทำให้ generative AI เข้ามามีบทบาทกับโลกเราอย่างมากและรวดเร็ว โดย Generative AI จะมีผลกระทบถึงเศรษฐกิจโลกดังนี้
ก่อนอื่นเล่าไปถึงว่า ที่เราเรียกว่า AI นี่มีอะไรบ้าง AI ก็ประกอบไปด้วย AI แบบต่าง ๆ ได้แก่
• Supervised Learning
• Generative AI
• Unsupervised Learning
• Reinforcement Learning
ซึ่งในคอร์สนี้เขาจะพูดถึงแค่ Supervised Learning กับ Generative AI
💡 Supervised Learning คือ การที่เราสอน AI โดย labeled data โดยการใส่ input A เข้าไปเพื่อให้ได้ output B โดยเราต้องสอนให้ AI หาคำตอบ หรือ output ได้ด้วยตัวเอง โดยยการเรียนรู้จากชุดข้อมูลตัวอย่าง
💡 ส่วน Generative AI คือ AI ที่สามารถผลิต content คุณภาพสูง จำพวกข้อความ รูปภาพ และเสียงได้
เมื่อ data มีปริมาณมากขึ้นเรื่อย ๆ เราจำเป็นต้องสร้าง Large AI Models ขึ้นมาเพื่อให้มีประสิทธิภาพสูงขึ้นด้วย
Large Language Model หรือที่เราได้ยินกันบ่อย ๆ ว่า LLM ก็เป็นตัวหนึ่งที่ใช้ในการสร้างข้อความขึ้นมา
……………..
“LLM as a thought partner”
LLM ถูกสร้างมาจาก supervised learning (ที่ทำนาย input จาก A ไป B )โดยมันทำงานโดยการการทำนายคำต่อไปหรือ predict the next word ซ้ำๆ ไปเรื่อย เช่น
รอบที่ 1
Input (A) คือ My favorite food is a…
Input (B) คือ Bagel
รอบที่ 2
Input (A) คือ My favorite food is a bagel…
Input (B) คือ with
รอบที่ 3
Input (A) คือ My favorite food is a bagel with…
Input (B) คือ cream
รอบที่ 3
Input (A) คือ My favorite food is a bagel with cream…
Input (B) คือ cheese
เมื่อจบก็จะได้ประโยคที่ว่า My favorite food is a bagel with cream cheese.
และเมื่อเรา train AI ด้วยข้อมูลจำนวนมหาศาล เราก็จะได้ Large Language Model แบบ ChatGPT นั่นเองครับ
4. Gen AI ทำงานได้ไม่ค่อยดีกับ structured data เช่น ข้อมูลที่ให้เป็นตารางในลักษณะให้ predict ค่าจาก A ไป B ในกรณีนี้ให้ใช้ supervised learning ตัว Gen AI เองทำงานได้ดีกับ unstructured data ซึ่งก็ได้แก่ พวก text รูปภาพ เสียง วิดีโอ
Andrew ได้ให้คำแนะนำในการเขียน prompt ไว้ 3 ข้อดังนี้
• Be detailed and specific เขียนให้ละเอียดและจำเพาะเจาะจงให้มากที่สุด ให้ context ที่เพียงพอ
• ให้คำแนะนำ model คิดในการคิดอย่างเป็นระบบ เช่น ระบุไปเลยว่าขั้นตอนที่ 1, 2, 3 ให้ทำอะไรเป็นขั้นตอน
• Experiment and iterate ทดลอง และทำซ้ำให้ดีขึ้นเรื่อย
……………..
“Life cycle of a generative AI project”
เข้าสู่เนื้อหาในสัปดาห์ที่ 2 Andrew จะอธิบายการนำ Gen AI ไปใช้ใน software applications ต่าง ๆ ซึ่ง Life cycle ของการทำ application จะเป็นแบบนี้
Scope project -> Build/Improve system -> Internal evaluation -> Deploy and monitor
ซึ่งการสร้าง Gen AI software ก็เป็นการทดลองรูปแบบหนึ่ง คือ เป็นการสร้าง prototype เร็ว ๆ มาทดสอบ (Andrew บอกว่าบาง applications เขาทำ prototype กันแค่ 1-2 วันเท่านั้น) หาข้อผิดพลาดและแก้ไขวนลูปไปจนได้ model ที่โอเค ซึ่ง tools ที่จะใช้ปรับปรุง Gen AI ก็คือ
🔘 การ prompt แล้วดู response ที่ได้ว่าโอเคมั้ย
🔘 การให้ LLM สามารถเข้าถึง data sources ภายนอก หรือที่เราเรียกว่า RAG (Retrieval augmented generation) ตัวอย่าง application ที่ใช้ RAG ก็ได้แก่พวก chat with PDF files
🔘 การปรับจูน fine tuning model เพื่อช่วยใน LLM รู้ข้อมูลที่จำเพาะเจาะจง เช่น อยากให้เขียนเป็น style ที่เราอยากให้เป็น ก็ต้องระบุไป
🔘 การ pre-training models โดยให้เรียนรู้จาก text ใน internet
……………..
“Big Idea : LLM as reasoning engine”
Andrew ให้วิธีคิดในการมองการใช้ LLM ว่า LLM รู้เยอะก็จริง แต่มันไม่ใช่ knowledge store แต่ให้คิดว่ามันเป็น “reasoning engine” อันนี้เป็นแนวคิดหลักที่เราทุกคนต้องเข้าใจให้ถูกต้อง
☑️ เพราะ LLM ไม่ได้รู้ทุกสิ่ง (จากข้อจำกัดที่กล่าวไว้ข้างต้น) ถึงแม้ว่ามันจะมีความสามารถอ่านข้อมูลต่าง ๆ ได้เยอะมากใน internet
☑️ ในตัวอย่างของการใช้ RAG เราสามารถให้ข้อมูลเพิ่มเติมใน prompt ได้เพื่อให้มันอ่านข้อมูลเหล่านั้นแล้วนำไป process หาคำตอบ
☑️ เราต้องใช้เป็น reasoning engine เพื่อที่จะใช้ process ข้อมูลต่าง ๆ แทนที่จะใช้มันเป็น source of information
……………..
“Cost intuition”
Andrew เล่าว่าเขาเองก็โดนถามบ่อยว่าการนำ Gen AI หรือ LLM มาใช้นั้นราคาแพงหรือไม่ ในความรู้สึกเราดูเหมือนว่าน่าจะเป็นต้นทุนที่สูง แต่ Andrew บอกว่าจริง ๆ มันถูกกว่าที่เราคิดเยอะ โดยการประเมินราคาเราจะคิดตามจำนวน tokens ของ input และ output
หากเราพิจารณาความเป็นไปได้ของ Gen AI ที่จะมาทดแทน task ต่างๆ ข้างต้นเราจะเห็นได้ว่า AI นั้นมี potential ที่จะทดแทน task ได้แค่บางอย่างเท่านั้น เช่น การร่างและตรวจสอบเอกสาร หรือ การตีความกฎหมาย แต่งานประเภทการเจรจาหรือไปขึ้นศาลนั้นยากที่ Gen AI จะมาทดแทนได้
💡 โดยการนำ AI มาใช้เราทำได้สองแบบคือ Augmentation คือการให้มันช่วยเราหรือ recommend เรา หรือ Automation ที่ให้มันทำงานแทนเราไปเลย โดยทั่วไปเรามักจะเริ่มใช้ AI ช่วยเราก่อนหรือ Augmentation ก่อนนั่นเองครับ
……………..
“Automation potential across sector”
หลายคนน่าจะเข้าใจว่า AI จะมาทดแทนงานที่ไม่ซับซ้อนและเป็นงานค่าแรงที่ไม่สูงนัก แต่จากการศึกษาที่ OpenAI นั้นพบว่า Generative AI จะมาทดแทนงานที่มีค่าแรงสูงมากกว่า 😲
และหากเข้าไปดูการศึกษาของทาง McKinsey จะพบว่างานจำพวก customer service นั้นจะโดนทดแทนได้มากในแง่ของ total spending แต่ทั้งนี้ทั้งนั้น Andrew ก็ได้เตือนว่าถึงเราจะอยู่ในธุรกิจที่งานไม่โดนกระทบมากในแง่ของมูลค่า แต่ก็มีโอกาสที่จะทำให้การทำธุรกิจนั้นมีการเปลี่ยนแปลงได้เช่นกัน
และหากเราดูในแง่ของผลกระทบเทียบเป็น industry section จะพบว่า Generative AI นั้นมีผลกระทบต่อ “knowledge worker” ซึ่งส่วนใหญ่จะเป็นคนทำงานที่ใช้ความรู้ นั่ง office มากที่สุดนั่นเองครับ 😱
……………..
“Concerns about AI”
ในส่วนท้าย ๆ ที่จะพูดถึงคือ ข้อกังวลใจของสังคมในแง่มุมต่าง ๆ ซึ่ง Andrew นำมาอธิบายให้ฟัง 3 เรื่อง
1) AI จะทำให้มนุษยชาติยิ่งแย่ไปอีกหรือไม่
Andrew อธิบายว่า LLMs นั้นถูก train จากข้อมูลใน internet ซึ่งมีทั้งข้อมูลในส่วนที่แสดงความยอดเยี่ยมของมนุษย์และความเลวร้ายของมนุษย์เช่นเดียวกัน ส่วนที่ว่ามันจะทำให้เรายิ่งแย่ลงไป Andrew มองว่าไม่ เพราะยิ่งนานไป LLM จะถูก train ให้ดีขึ้น มี bias น้อยลงไปเรื่อย ๆ จากการทำ fine tuning และอีกเทคนิคที่เรียกว่า RLHF หรือ Reinforcement Learning from Human Feedback ซึ่งคือการที่มนุษย์ไปใส่ข้อมูลเพิ่ม train AI เพื่อลด bias
2) การสูญเสียงานของมนุษย์ (Job loss)
มีคนบอกว่า Radiologist น่าจะตกงานในเร็ววันเนื่องจากการมาแทนของ AI แต่หากเราใช้วิธีแตกรายละเอียด task ต่าง ๆ ที่ Radiologist ต้องทำ จะเห็นว่ายังมี task อีก หลาย task ที่ AI ไม่สามารถทำแทนได้ แม้ว่าหน้าที่การอ่านฟิล์ม X-rays นั้น AI จะทำได้ดีกว่ามนุษย์ แต่งานจำพวกการที่ต้อวสื่อสารผลการตรวจให้กับคนไข้ หรือ การตอบสนองและแก้ปัญหาระหว่างกระบวนการนั้นก็ยังยากที่ AI จะมาทำได้ดีเท่า ดังนั้นในความเป็นจริงมนุษย์จะไม่ถูกทดแทนแต่จะใช้ AI มาช่วยให้ทำงานได้ดีขึ้นมากกว่า
Curtis Langlotz professor ที่ Stanford University กล่าวไว้ว่า
“AI won’t replace radiologists. But radiologists who use AI will replace radiologists that don’t”
3) การสูญพันธ์ของมนุษย์ (Human Extinction)
คำถามสำคัญที่ว่าแล้ว AI จะทำลายล้างเผ่าพันธุ์มนุษย์ (แบบในหนังเรื่อง Terminator) หรือไม่นั้น Andrew นั้นบอกว่าในทุกเทคโนโลยีใหม่ที่เกิดขึ้นเรามักจะได้ยินข่าวความผิดพลาดอยู่เป็นระยะ เช่น self-driving car ที่ทำงานผิดพลาดขับรถชนรถตาย หรือ ในปี 2010 ที่ trading algorithm ทำงานผิดพลาดจนหุ้นร่วงอย่างหนัก