10 ธ.ค. 2024 เวลา 13:33 • วิทยาศาสตร์ & เทคโนโลยี

Day 3: Sora – โมเดล AI สร้างวิดีโอ เปิดโลกใหม่แห่งการสร้างสรรค์

สิ้นสุดการรอคอย! ในวันที่ 9 ธันวาคม 2567 ซึ่งเป็นวันที่ 3 ของ “12 Days of OpenAI” ทาง OpenAI ได้เปิดตัว “Sora” โมเดล AI ที่สามารถสร้างวิดีโอจากข้อความหรือภาพนิ่งให้กลายเป็นวิดีโอที่มีการเคลื่อนไหวสมจริงอย่างเป็นทางการ โดย Sora เริ่มเปิดตัวครั้งแรกในเดือนกุมภาพันธ์ 2024 ต่อมาในวันที่ 9 ธันวาคม 2024 Sora ได้เปิดให้บริการแก่ผู้ใช้ ChatGPT Plus และ Pro อย่างเป็นทางการ นี่คือก้าวสำคัญที่ทำให้ทุกคนสามารถสร้างสรรค์วิดีโอคุณภาพสูงได้ง่าย ๆ เพียงแค่ป้อนคำหรือภาพ
Tweet จาก Sam Altman
Sora คืออะไร?
Sora คือโมเดลสร้างวิดีโอด้วย AI ที่พัฒนาโดย OpenAI โดยมุ่งเน้นการช่วยผู้ใช้งานสร้างวิดีโอคุณภาพสูงจากข้อความ (Text-to-Video) หรือภาพที่กำหนด เป็นนวัตกรรมใหม่ที่ช่วยให้การสร้างสรรค์วิดีโอทำได้อย่างง่ายดายและทรงพลัง เหมาะสำหรับการใช้งานเชิงศิลปะ การตลาด และการเล่าเรื่อง
คุณสมบัติเด่นของ Sora
1. สร้างวิดีโอจากข้อความและภาพ
Sora ช่วยให้ผู้ใช้งานสามารถป้อนข้อความ หรืออัปโหลดภาพ/วิดีโอ เพื่อสร้างวิดีโอที่มีความละเอียดสูงสุดถึง 1080p และความยาวสูงสุด 20 วินาที
2.การปรับแต่งวิดีโอหลากหลาย
ผู้ใช้สามารถปรับเปลี่ยน Aspect Ratio, Resolution, Duration, และ Number of Variations เพื่อให้ได้วิดีโอที่ตรงตามความต้องการ
3.ฟีเจอร์การแก้ไขขั้นสูง
  • Re-cut: ตัดต่อและเพิ่มฉากใหม่
  • Remix: ปรับแต่งวิดีโอด้วยคำสั่งใหม่
  • Blend: เชื่อมต่อองค์ประกอบระหว่างวิดีโอสองตัว
  • Loop: สร้างวิดีโอที่เล่นวนอย่างต่อเนื่อง
4.Storyboard Editor
ผู้ใช้สามารถสร้างวิดีโอโดยควบคุมเฟรมแต่ละช่วงของเรื่องราว ตั้งค่าเวลาสำหรับแต่ละฉาก และสร้างความลื่นไหลระหว่างฉากได้อย่างมีประสิทธิภาพ
5.การแชร์และจัดเก็บ
  • ดาวน์โหลดวิดีโอในรูปแบบ MP4
  • แชร์วิดีโอผ่านลิงก์
  • จัดเก็บวิดีโอใน Library หรือเพิ่มเป็น Favorite เพื่อหาได้ง่ายในอนาคต
การทำงานของ Sora
1. Input: การป้อนข้อความหรือภาพ
Text Prompt: ผู้ใช้งานเริ่มต้นด้วยการป้อนข้อความที่อธิบายถึงวิดีโอที่ต้องการ เช่น "พระอาทิตย์ขึ้นเหนือภูเขาในตอนเช้า"
Image Input (Optional): ผู้ใช้สามารถอัปโหลดภาพนิ่งเพื่อใช้เป็นฐานข้อมูลสำหรับสร้างวิดีโอ
2. การแปลงข้อความเป็นภาพเคลื่อนไหว
Sora ใช้ Diffusion Model เป็นเทคโนโลยีหลักในการสร้างวิดีโอ โดยมีขั้นตอนดังนี้:
2.1 เริ่มต้นจาก Noise Video: สร้างวิดีโอเริ่มต้นที่เป็น "เสียงรบกวน" (noise)
2.2 ปรับปรุงทีละเฟรม: ระบบจะปรับเปลี่ยนและสร้างภาพเคลื่อนไหวทีละเฟรมเพื่อให้วิดีโอออกมาตรงกับข้อความที่ป้อน
2.3ใช้ Transformer Architecture: โครงสร้างนี้ช่วยให้ Sora ประมวลผลข้อความและสร้างวิดีโอได้อย่างแม่นยำและรวดเร็ว
3. การเพิ่มความสมจริง
  • Recaptioning (เทคนิคจาก DALL·E 3): Sora ใช้เทคนิคการปรับปรุงคำอธิบายภาพเพื่อให้วิดีโอมีความสอดคล้องกับคำสั่งของผู้ใช้มากขึ้น
  • การประมวลผลสีและแสง: ใช้ AI เพื่อปรับแต่งสี แสง และการเคลื่อนไหวให้ดูสมจริง
4. การสร้างวิดีโอสำเร็จรูป
  • ระบบจะสร้างวิดีโอที่มีคุณสมบัติตรงตามข้อความหรือภาพที่ป้อนมา
  • วิดีโอที่ได้จะมีความละเอียดสูงสุดถึง 1080p (ขึ้นอยู่กับระดับสมาชิก)
5. การควบคุมและป้องกันการใช้งานผิดวัตถุประสงค์
  • Watermark และ Metadata: วิดีโอทั้งหมดจะมีลายน้ำและข้อมูลเมตา (C2PA) เพื่อระบุว่าเป็นเนื้อหาที่สร้างจาก AI
  • Content Filtering: ระบบบล็อกเนื้อหาที่ไม่เหมาะสม เช่น Deepfake หรือเนื้อหาที่ละเมิดกฎหมาย
6. การประมวลผล Relaxed และ Priority
  • Priority Mode: ใช้เครดิตในการสร้างวิดีโอแบบเร่งด่วน
  • Relaxed Mode: ใช้เวลานานกว่าและเหมาะสำหรับงานที่ไม่เร่งด่วน โดยไม่ต้องใช้เครดิต
แผนการใช้งานและเครดิต
Sora เปิดให้บริการผ่านเว็บไซต์ Sora.com โดยมีแพ็กเกจการใช้งานดังนี้
  • ChatGPT Plus: $20 ต่อเดือน เครดิต 1000/เดือน สำหรับการสร้างวิดีโอความละเอียด 720p จำนวน 50 วิดีโอต่อเดือน
  • ChatGPT Pro: $200 ต่อเดือน เครดิต 1000/เดือน สำหรับการสร้างวิดีโอความละเอียด 1080p ไม่จำกัดจำนวน
หมายเหตุ:
  • สมาชิก ChatGPT Free, Enterprise, และ Edu ยังไม่สามารถใช้งาน Sora ได้ในขณะนี้
  • จากการตรวจสอบโดยผู้ใช้ระดับ Plus ปัจจุบันยังไม่สามารถเข้าใช้ได้ เนื่องจากมีความต้องการใช้สูง ทาง OpenAI กำลังเร่งแก้ไขปัญหา
ความสำคัญของ Sora
Sora ไม่เพียงช่วยให้การสร้างวิดีโอเป็นเรื่องง่าย แต่ยังเปิดโอกาสใหม่ในการสร้างสรรค์สื่อดิจิทัล ผู้ใช้สามารถเปลี่ยนไอเดียเป็นวิดีโอได้ทันที พร้อมกับลดต้นทุนและเวลาการผลิต สมาชิก ChatGPT ระดับ Plus และ Pro สามารถเข้าใช้ได้ผ่าน Sora.com ได้เลยครับ
ในส่วนการเปิดตัวของ Day3 ถือว่าสมการรอคอยของหลายๆคน ติดตามกันอีกครั้งกับ Day4 ทาง OpenAI จะเปิดตัวอะไรที่จะเป็นนวัตกรรมใหม่ในวงการ AI ที่จะเปลี่ยนแปลงโลกอีกครั้ง เราจะเอาข้อมูลมาฝากทุกคนแน่นอน โปรดติดตามกันด้วยนะครับ
แหล่งที่มา
1.OpenAI: Sora Launch Announcement
2.Reuters: Text-to-Video AI Sora
3.The Verge: OpenAI Sora Review

ดูเพิ่มเติมในซีรีส์

โฆษณา