และจำรูปแบบที่ทำให้สามารถสร้างข้อความของตัวเองที่เลียนแบบรูปแบบการเขียนต่าง ๆ ได้ โดย มีการรวบรวมข้อมูลมาจาก เว็บไซต์ต่าง ๆ หนังสือ และ Wikipedia
นอกจากนี้ ChatGPT ยังมีการเรียนรู้โดยใช้วิธี Reinforcement Learning from Human Feedback (RLHF) โดยทุกครั้งที่ ChatGPT ได้รับคำถาม ก็จะเหมือนเป็นการฝึก AI นี้ให้เก่งขึ้นและคุณภาพดีขึ้นเรื่อย ๆ และยังมีการสร้างโมเดลผ่านข้อความแบบวิธี Proximal Policy Optimization (PPO) ซึ่งวิธีนี้จะสามารถให้เพิ่มความรู้ได้
4
และไม่นานมานี้ มีรายงานว่า Microsoft ประกาศการลงทุนใหม่มูลค่าหลายพันล้านดอลลาร์กับ OpenAI ผู้สร้าง ChatGPT โดยการลงทุนในครั้งนี้จะช่วยเร่งความก้าวหน้าในด้าน AI และเรื่องผลประโยชน์ของทั้งสองบริษัทได้ในอนาคต