5 ก.ค. 2021 เวลา 07:00
ใช้ AI สร้าง ‘มีม’ ให้เราได้ ง่ายนิดเดียว
อยากทำมีมขำ ๆ เป็นของตัวเอง เอาไปเล่นกับเพื่อนสักอัน แต่ขี้เกียจเข้า Photoshop เลือกรูปและแปะคำเอง ลองใช้เอไอทำให้ ด้วยโปรแกรม AI-Memer
โรเบิร์ต กอนซัลเวส (Robert Gonsalves) ศิลปินและวิศวกรรมจากบอสตัน ได้สร้างโปรแกรมเอไอที่จะสร้างมีมให้เราได้อัตโนมัติ โดยใช้ชื่อว่า AI-Memer ซึ่งเจ้า AI-Memer เกิดขึ้นได้โดยการนำโมเดลสุดล้ำในท้องตลาดหลากหลายอัน มาช่วยดำเนินการในแต่ละขั้นตอน เช่น โมเดล CLIP encoder นั้นถูกนำมาประยุกต์ใช้ในการหาภาพ จากนั้นใช้ GPT-Neo ในการคิดแคปชัน เป็นต้น
ในการใช้งาน AI-Memer ผู้ใช้สามารถเริ่มต้นด้วยการหาภาพพื้นหลังที่ต้องการก่อน โดยสามารถพิมพ์คีย์เวิร์ดคำที่ต้องการได้เลย ระบบจะไปหารูปภาพจาก Wikimedia และชุดข้อมูล OpenImages มาให้เรา โรเบิร์ตได้ใช้ระบบ CLIP encoder จาก Open AI ทำการเสิร์ชหาภาพที่เกี่ยวข้องกับคียเวิร์ดของเรา โดยจะเสิร์ชดูจากคำอธิบายภาพที่ติดมากับภาพ และดูไปถึงความหมายตามบริบทหรือธีมของภาพอีกด้วย จากนั้นจึงแสดงผลเป็น 10 ภาพที่เกี่ยวข้องกับคีย์เวิร์ดของเราที่สุดมาให้เราเลือก
ขั้นต่อมา เมื่อเราเลือกภาพแล้ว โมเดล GTP-3 จาก OpenAI และ GPT-Neo จาก EleutherAI จะออกโรงต่อ โดยจะทำการคิด 10 แคปชันที่เหมาะกับรูปที่เราเลือกมาให้เสร็จสรรพ ที่เราต้องทำก็แค่เลือกอันที่ถูกใจที่สุด และเตรียมดาวน์โหลดมีมของเราได้เลย เป็นไงครับ? แม้แคปชันก็ไม่ต้องคิดเอง เป็นความสะดวกสบายที่ล้ำมากครับ
You can build your own meme to share among your friends without having to use Photoshop, but with machine learning called AI-Memer that generates memes using the latest AI models instead.
Robert Gonsalves, an artist, inventor and engineer from Boston has created AI-Memer, an AI system that can generate memes automatically, using many latest models in the market in each step such as CLIP encoder to first perform a semantic search on the text descriptions and GPT-Neo is used to generate possible captions.
To start using the AI-Member system to create memes, first, users have to find background images which will be pulled from Wikimedia and OpenImages dataset. Robert has used clip encoder from Open AI to perform a semantic search that relates to the keywords.The clip model will display 10 related images with text labels such that the embeddings encoded from the images will be similar to the embeddings encoded from the text labels.
The next step is, when the image is chosen, GPT-3 from OpenAI and GPT-Neo from EleutherAI will continue generating 10 possible captions to suit the selected image where we just need to select the one we prefer the most. Lastly, you can download your meme right away. No caption you need to even have to by yourself!
บทความโดย: ทีม Sertis
โฆษณา