4 ก.พ. 2021 เวลา 13:00 • วิทยาศาสตร์ & เทคโนโลยี
มาดูกัน! ว่าโซเชียลมีเดียนิยมใช้อัลกอริทึมอะไรในการดันบทความ
1
เพื่อน ๆ เคยสงสัยไหมว่า social media ต่าง ๆ ที่เราใช้กันอยู่ทุกวันมีวิธีอะไรในการเลือกบทความมาแสดงให้เราดู
2
วันนี้ ITGirl จะมานำเสนอหนึ่งในอัลกอริทึมที่นิยมใช้กัน เรียกว่า
1
"ปัญหาของ Multi-armed Bandits (ผู้ร้ายหลายอาวุธ)"
1
เรื่องราวจะเป็นอย่างไรนั้น
ตาม ITGirl มาฟังกันเลย
เรื่องมีอยู่ว่า
.
.
.
1
ณ ดินแดนอันไกลโพ้น มีผู้ร้ายคนหนึ่งต้องการจะทำลายภูเขาลูกหนึ่งให้ได้มากที่สุดภายใน 2 ชั่วโมง ถ้าหากเกินกว่านี้จะมีคนสังเกตได้และไปแจ้งตำรวจ
https://en.wikipedia.org/wiki/Mountain
โดยที่ตรงหน้าของผู้ร้ายคนนั้นมีอาวุธเป็นร้อย ๆ ชนิดตั้งเรียงรายกันให้ใช้ได้ไม่จำกัด
https://www.thisiscolossal.com/2011/04/museum-water-gun-fight/
อาจฟังดูเป็นเรื่องง่าย
แต่ทว่า อาวุธเหล่านั้น บางอาวุธก็ใช้การได้ไม่ดี อานุภาพการทำลายล้างต่ำ บางอาวุธใช้การได้บ้างไม่ได้บ้าง และก็มีบางส่วนที่ใช้ทำลายได้ดี
2
ปัญหาก็คือ ผู้ร้ายคนนี้เป็นคนบ้าน ๆ ไม่มีความรู้เรื่องอาวุธเลย
https://www.independent.co.uk/
แล้วผู้ร้ายจะเลือกใช้อาวุธอย่างไรให้เกิดประสิทธิภาพสูงที่สุด และทำลายภูเขาได้เร็วที่สุด
.
.
.
ถ้าหากเพื่อน ๆ เป็นผู้ร้ายคนนั้น เพื่อน ๆ จะทำอย่างไร
บางคนอาจจะบอกว่า ก็ลองใช้อาวุธแต่ละอันยิงไปที่เป้าหมายไปเรื่อย ๆ แล้วดูว่าอาวุธใดใช้งานดีที่สุด (exploration) ค่อยใช้อาวุธนั้นในการทำลาย (exploitation)
2
วิธีนี้ก็สมเหตุสมผลดี แต่ในความเป็นจริงกว่าจะทดลองจนครบและรู้ว่าอาวุธไหนดีที่สุด ก็กินเวลาไปนานมากเสียแล้ว เหลือเวลาให้ใช้อาวุธที่ดีที่สุดนั้นแค่ไม่กี่นาที
3
หรืออีกวิธีหนึ่ง
คือทดลองใช้อาวุธไปไม่กี่อัน แล้วตัดสินเลยว่าอันไหนดี ก็ใช้อาวุธนั้นมากเป็นพิเศษ (exploitation) สลับกับทดลองใช้อาวุธอื่น ๆ (exploration)
6
ถ้ายังไม่เจออาวุธใหม่ที่ดีกว่า ก็ใช้อาวุธอันที่ดีที่สุดที่เจอเป็นหลัก สลับกับทดลองใช้อาวุธอื่น ๆ ไปด้วย
3
วิธีนี้จะได้ผลลัพธ์ที่พอใช้ได้ตั้งแต่ช่วงเริ่มต้น และจะดีขึ้นเรื่อย ๆ เมื่อเวลาผ่านไป
3
ซึ่งการที่เราจะได้ประสิทธิภาพสูงสุด คือเราจะต้อง balance ระหว่าง exploitation (การใช้ประโยชน์จากสิ่งที่ดีที่สุดอยู่แล้ว) กับ exploration (การสำรวจสิ่งใหม่ ๆ) ให้เหมาะสม
5
เมื่อได้ทดลองยิงมากขึ้น โอกาสที่จะเจออาวุธที่ดีกว่าย่อมน้อยลง ดังนั้นเราก็จะ explore ให้น้อยลง และ exploit ให้มากขึ้น
4
แต่ถ้าจำนวนครั้งในการทดลองยังน้อย เราก็ต้อง explore ให้มาก ๆ ไว้ก่อนและ exploit น้อย ๆ เป็นต้น
3
วิธีนี้จึงเป็นการประหยัดเวลา ไม่ต้องทดลองใช้จนครบหมดทุกอันแบบวิธีแรก แต่เป็นการ
6
“ใช้ประโยชน์ (exploit)” จากสิ่งที่ดีอยู่แล้วไปพร้อม ๆ กับ “หาสิ่งใหม่ ๆ (explore)” เพื่อให้ได้ "ทำลายภูเขา (reward)" ให้มากที่สุด
7
นั่นเอง
เปรียบเทียบปริมาณการใช้งานแต่ละอาวุธในวิธีที่ 1 (ด้านซ้าย) กับวิธีที่ 2 (ด้านขวา) จะเห็นว่าในตอนแรกมีการใช้งานทั้ง 3 อาวุธเท่ากัน แต่เมื่อเวลาผ่านไป วิธีที่ 2 จะมีการใช้อาวุธที่ให้ผลลัพธ์ดีที่สุดมากขึ้นเรื่อย ๆ และใช้ได้เต็มอัตราก่อนวิธีที่ 1
https://www.dynamicyield.com/ru/glossary/contextual-bandit/
และวิธีที่สองนี้เองคือวิธีที่ social media มักใช้ในการตัดสินใจว่าจะแสดงบทความใดต่อผู้ใช้งาน
หาก reward ของผู้ร้ายคือ ความเสียหายที่ภูเขานั้นถูกทำลาย
reward ของ social media ก็คงจะเป็นการมีส่วนร่วมของผู้ชม
แต่เนื่องจากมีเนื้อหาให้เลือกมากมาย (มีอาวุธให้ใช้หลายอัน) รวมถึงไม่มีข้อมูลเกี่ยวกับผู้ใช้งานว่ามีรสนิยมอะไร (ไม่รู้ว่าภูเขานั้นต้องใช้อาวุธใดในการทำลาย)
1
ดังนั้นจึงนิยมใช้วิธีการแก้ปัญหาของ Multi-armed Bandits นั่นเอง
1
ตัวอย่างการ explore เช่น การดันโพสต์ของเพจที่เปิดใหม่ เพื่อเปิดโอกาสให้แต่ละเพจได้แสดงความสามารถของตนเอง
2
หลังจากนั้น ก็ดู performace ของเพจแต่ละเพจ ว่าจะมี content ให้ exploit เพื่อเพิ่มการมีส่วนร่วมของผู้ชมได้หรือไม่
ตัวอย่างของตัวชี้วัดการมีส่วนร่วม (ข้อมูลจาก Google Analytics) ก็เช่น
1
Pageviews = จำนวนคนที่มาเยี่ยมชมเพจ
1
Average Time on Page = ระยะเวลาที่ผู้อ่านใช้ในการเยี่ยมชมเพจ
1
Average Pages per session = จำนวนโพสต์ในเพจที่ผู้มาเยี่ยมชมอ่านต่อการเยี่ยมชมหนึ่งครั้ง (session)
1
Returning Visitors = จำนวนผู้ใช้ที่กลับมาเยี่ยมชมเพจ
1
Goal Conversion Rate = Engagement per post
1
ซึ่งถ้าเพจใดมีการมีส่วนร่วมสูง ก็จะถูก exploit เพิ่มขึ้นเรื่อย ๆ
2
นอกจากนี้ เรื่อง Multi-armed bandit นี้ยังสอนเราเช่นกันว่า ในชีวิตของเราไม่จำเป็นต้องรอจนกว่าจะเจอสิ่งที่ดีที่สุด เพราะเราไม่รู้ว่าสิ่งที่ดีนั้นมันดีจริงหรือไม่ อาจจะมีสิ่งที่ดีกว่า ดังนั้นให้ลงมือทำสิ่งที่เราทำได้ก่อน แล้วจึงไป explore สิ่งอื่น ๆ เพิ่มเติม
12
แล้วเพื่อน ๆ คิดอย่างไรบ้างกับอัลกอริทึมนี้
2
หรือบางคนอาจจะมีตัวชี้วัดอื่น ๆ จากประสบการณ์ที่เคยเขียนมา มาแชร์กันได้นะคะ
ถ้าชอบ อย่าลืม กดไลค์ กดแชร์ กดติดตาม ITGirl
2
สำหรับวันนี้ต้องขอลาไปก่อน
รักผู้อ่านและผู้อ่านชาว blogger ทุกคน
โฆษณา