Blockdit Logo
Blockdit Logo (Mobile)
สำรวจ
ลงทุน
คำถาม
เข้าสู่ระบบ
มีบัญชีอยู่แล้ว?
เข้าสู่ระบบ
หรือ
ลงทะเบียน
Yod.net
•
ติดตาม
26 ม.ค. เวลา 01:56 • วิทยาศาสตร์ & เทคโนโลยี
คอมพิวเตอร์กลายเป็นอัจฉริยะแล้ว! OpenAI เปิดตัวตัวแทน AI Operator ที่สามารถท่องเว็บได้เหมือนมนุษย์
เมื่อวันพฤหัสบดีที่ผ่านมา พี่แซมของ เรา (OPENAI) ได้โพสลง X ส่วนตัว และได้ จัดงานถ่ายทอดสดกะทันหัน โดยเปิดตัวเครื่องมือตัวแทน AI ตัวแรกที่มีชื่อว่า Operator (หรือที่หมายถึงตัวดำเนินการ) ที่ทุกคนรอคอยมานาน เครื่องมือนี้สามารถดำเนินการแทนผู้ใช้เพื่อดำเนินการบนเว็บได้
หากจะพูดให้เข้าใจง่ายๆ ก็คือ ผู้ปฏิบัติงานสามารถใช้เว็บเบราว์เซอร์ได้เหมือนกับมนุษย์
ไม่เหมือนแชทบอทที่ตอบคำถามเพียงข้อเดียว ตัวแทน AI จะสามารถทำงานที่ได้รับมอบหมายให้สำเร็จได้ภายใต้การดูแลของมนุษย์ที่จำกัด และยังถูกมองว่าเป็นก้าวสำคัญถัดไปในด้านประสิทธิภาพการทำงานของ AI อีกด้วย ในบรรดา 5 ขั้นตอนของ OpenAI ที่จะนำไปสู่ปัญญาประดิษฐ์ทั่วไป (AGI) เอเจนต์ AI ถือเป็นขั้นตอนที่สาม ต่อจากแชทบอทและหุ่นยนต์ใช้เหตุผล และยังเป็นก้าวใหม่เอี่ยมอีกด้วย
Sam Altman กล่าวว่าตั้งแต่วันพฤหัสบดีเป็นต้นไป ผู้ใช้ ChatGPT Pro ในสหรัฐอเมริกา (ชำระเงิน 200 ดอลลาร์ต่อเดือน) จะสามารถใช้งาน Operator "เวอร์ชันตัวอย่างสำหรับการวิจัย" ได้ ในอนาคตจะมีการขยายไปยังผู้ใช้ Pro ในภูมิภาคต่างๆ มากขึ้น และภายในอีกไม่กี่เดือน ผู้ใช้ ChatGPT Plus ก็จะสามารถใช้งานได้เช่นกัน และจะมีการเปิดตัวตัวแทน AI เพิ่มเติมในอีกไม่กี่สัปดาห์หรือเดือนข้างหน้า
ตัวดำเนินการขับเคลื่อนโดยโมเดลใหม่ที่เรียกว่า CUA (Computer Using Agents) ซึ่งผสมผสานความสามารถด้านภาพของ GPT-4o เข้ากับการใช้เหตุผลระดับสูงที่เปิดใช้งานด้วยการเรียนรู้แบบเสริมแรง ผู้ปฏิบัติงานสามารถ "ดู" หน้าเว็บ (ถ่ายภาพหน้าจอ) และโต้ตอบกับหน้าเว็บได้โดยใช้การดำเนินการทั้งหมดที่อนุญาตโดยเมาส์และคีย์บอร์ด หากพบปัญหาระหว่างการทำงาน โมเดลจะใช้ความสามารถในการใช้เหตุผลเพื่อแก้ไขตัวเอง หากปัญหายังไม่สามารถแก้ไขได้ การควบคุมจะถูกส่งกลับไปยังมนุษย์
เพื่อจะเข้าใจสิ่งใหม่นี้ เราต้องมีกรณีที่สดใหม่และชัดเจน
อินเทอร์เฟซของ Operator นั้นคล้ายคลึงกับ ChatGPT ซึ่งเป็นแชทบอท ความแตกต่างที่ใหญ่ที่สุดก็คือ Operator จะเรียก "ตัวแทน AI" เพื่อทำตามคำสั่งของผู้ใช้
ในกรณีสาธิต เจ้าหน้าที่จะได้รับการขอให้จองโรงแรม ผู้ใช้เพียงป้อนข้อความ “จองโต๊ะที่ร้านอาหาร XX เวลา 19.00 น. คืนนี้” ในกล่องโต้ตอบ จากนั้นตัวแทน AI จะเปิดเว็บเพจ เข้าสู่เว็บไซต์การจอง ค้นหาร้านอาหาร และดำเนินการจองให้เสร็จสิ้น
หากช่องเวลาที่ผู้ใช้ต้องการถูกจองแล้ว AI จะถามว่า "โต๊ะเวลา 19:00 น. ถูกจองแล้ว แต่โต๊ะเวลา 19:45 น. ยังว่าง คุณต้องการจองหรือไม่"
ในอีกกรณีหนึ่ง ผู้ใช้ได้อัพโหลดรายการซื้อของชำรวมทั้ง "EGG Spinach Mushrooms Chicken thighs Chilli Crunch (ไข่ ผักโขม เห็ด น่องไก่ พริกกรอบ)" และขอให้ผู้ให้บริการดำเนินการบนเว็บไซต์การซื้อของชำ จากนั้น AI จะเปิดเบราว์เซอร์ ค้นหาทีละรายการและเพิ่มลงในตะกร้าสินค้า
หลังจากเสร็จสิ้นภารกิจ เจ้าหน้าที่จะแจ้งให้ผู้ใช้ทราบว่ายอดรวมเป็นเท่าไร และคนขับจะมาถึงเมื่อใด จากนั้นจึงคืนการควบคุมเบราว์เซอร์ให้กับมนุษย์
OpenAI ยังเตือนผู้ใช้ว่าแม้ว่า Operator จะเป็นตัวแทน AI ที่แข็งแกร่งที่สุดในตลาดแล้ว แต่ก็ยังตามหลังมนุษย์อยู่มาก ตัวอย่างเช่นในการทดสอบประสิทธิภาพโดยใช้เบราว์เซอร์ โมเดล CUA ของ OpenAI ทำคะแนนได้ 58.1% แต่สำหรับมนุษย์สามารถทำได้ถึง 78% ดังนั้นเทคโนโลยีใหม่นี้อาจยังเกิดข้อผิดพลาดได้ แต่จะยังคงปรับปรุงต่อไปในอีกไม่กี่เดือนข้างหน้า
ติดตามบทความดีดี ได้ตามช่องทาง โซเชี่ยลต่างๆ
FB,IG,Tiktok,YouTube ที่ yoddotnet
หรือเว็บไซด์
https://www.yod.net
เทคโนโลยี
ai
ข่าวรอบโลก
บันทึก
1
1
โฆษณา
ดาวน์โหลดแอปพลิเคชัน
© 2025 Blockdit
เกี่ยวกับ
ช่วยเหลือ
คำถามที่พบบ่อย
นโยบายการโฆษณาและบูสต์โพสต์
นโยบายความเป็นส่วนตัว
แนวทางการใช้แบรนด์ Blockdit
Blockdit เพื่อธุรกิจ
ไทย