12 ต.ค. 2022 เวลา 00:31 • หนังสือ
รหัสลับโซเชียลมีเดีย
โดย นำชัย ชีววิวรรธน์
Photo by Alexander Shatov on Unsplash
เวลาใช้เฟซบุ๊คหรือทวิตเตอร์ คนทั่วไปคงนึกไม่ถึงว่าสิ่งที่เราโพสต์นั้น นอกจากจะบอกถึง "ตัวตน" ของเราทั่วๆ ไปได้แล้ว ยังบอกลึกถึงตัวตนที่ลึกไปกว่านั้น รวมถึงบ่งบอกถึงลักษณะของเจเนชั่นตัวเอง หรือแม้แต่สภาพเศรษฐกิจและสังคมได้อีกด้วย
บอกได้อย่างไร ?
ปัจจุบันมีงานวิจัยจำนวนหนึ่งที่ต้องวิเคราะห์ข้อมูลมากมายมหาศาลที่มาเป็นก้อนโตๆ เรียกเป็นภาษาอังกฤษตรงไปตรงมาว่า Big Data
ข้อมูลพวกนี้อาจจะได้โดยตรงจากงานวิจัยบางอย่าง เช่น การอ่านลำดับข้อมูล "จีโนม (genome)" ของสิ่งมีชีวิตชนิดต่างๆ
คำว่า "จีโนม" คือ ดีเอ็นเอที่เป็นสารพันธุกรรมครบทั้งหมดของสิ่งมีชีวิตชนิดหนึ่งๆ
โดยที่เทคนิคด้านนี้ในช่วง 20 ปีที่ผ่านมาก็ก้าวหน้าไปไวมากๆ จากที่มีการลงทุนในอภิมหาโครงการจีโนมมนุษย์และจีโนมสัตว์ต่างๆ จำนวนมาก
แต่ที่มาของข้อมูลดังกล่าวยังอาจจะมาจากสื่อสังคมออนไลน์ทั้งหลายได้ด้วยเช่นกัน ไม่ว่าจะเป็นเฟซบุ๊ค หรือทวิตเตอร์ ฯลฯ
มีคณะนักวิจัยจากมหาวิทยาลัยเพนซิลเวเนีย สหรัฐอเมริกา ที่จับมือกับอีกทีมที่มหาวิทยาลัยเคมบริดจ์ สหราชอาณาจักร เขียนซอฟแวร์ที่สามารถไปดึงเอาข้อมูลที่คนจำนวนมากที่โพสต์ลงเฟซบุ๊คหรือทวิตเตอร์กันแต่ละวัน แล้วนำมาวิเคราะห์ด้วยโปรแกรมพิเศษที่วิเคราะห์ "ข้อมูลตัวอักษร" เหล่านี้ได้
ทำให้เห็นถึงลักษณะสำคัญบางอย่างของกลุ่มคน เห็นความเชื่อมโยงระหว่างกลุ่มคนกับปัจจัยทางเศรษฐกิจและสังคม เช่น รายได้ หรือแม้ครอบคลุมไปถึงเรื่องเพศ อายุ ชาติพันธุ์ และระดับการศึกษาของคนที่โพสต์
ผลลัพธ์ที่ได้น่าทึ่งทีเดียวล่ะครับ
ขอยกตัวอย่างงานวิจัยนะครับ งานชิ้นแรกตีพิมพ์อยู่ในเอกสารประกอบการประชุม Proceedings of the Seventh International AAAI Conference on Weblogs and Social Media (ICWSM) ปี 2013
โดยคณะนักวิจัยศึกษาเนื้อหาที่ทวีตกันในทวิตเตอร์ของพื้นที่เขต (county) ต่างๆ กว่า 1,300 แห่งในประเทศสหรัฐฯ ทำให้ทราบว่าในพื้นที่ซึ่งคนโพสต์ใช้คำเกี่ยวกับการออกกำลังกายและกิจกรรมกลางแจ้ง หรือเกี่ยวข้องกับความหมายของชีวิต รวมไปถึงเรื่องจิตวิญญาณ และงานดีๆ แสดงให้เห็นชัดเจนว่า คนในชุมชนเหล่านั้นมีความพึงพอใจกับชีวิต
Photo by Mariia Shalabaieva on Unsplash
ตรงกันข้ามกับคำเชิงลบอย่าง "น่าเบื่อ" หรือ "เหนื่อยหน่าย" ที่เชื่อมโยงกับสภาพแวดล้อมที่ชวนให้ไม่พึงพอใจ
งานวิจัยอีกชิ้นหนึ่งในปี 2013 เช่นกัน (Kern M., From 'sooo excited!!!' to 'so proud': Using language to study development, Development Psychology) พบว่า จากฐานข้อมูลผู้ใช้เฟซบุ๊คมากกว่า 70,000 คน ชี้ให้เห็นว่ากลุ่มคำที่แต่คนละช่วงอายุใช้นั้นมีความถี่แตกต่างกันอย่างเห็นได้ชัด
เช่น พวกวัยรุ่นจะใช้คำพวก "เกลียด" "เบื่อ" รวมไปถึงคำกลุ่มที่แสดงถึง "ความตื่นเต้น" หรือ "น่าสนอกสนใจ" สูงกว่าอย่างเห็นได้ชัดเจน
ในทางตรงกันข้ามกลุ่มที่อายุ 40 ปีขึ้นไปจะใช้กลุ่มคำเชิงลบด้วยความถี่ที่น้อยกว่าอย่างเห็นได้ชัด
1
แต่กลุ่มนี้เลือกใช้คำที่แสดงถึง "ความภาคภูมิใจ" หรือ "น่าปลาบปลื้มยินดี" บ่อยกว่าอย่างเห็นได้ชัดเจน โดยกลุ่มอายุที่ใช้คำทุกกลุ่มที่ว่ามาข้างต้นเท่าๆ กันคือ พวกอายุใกล้ๆ กับ 35 ปี
เห็นได้ว่าพวกอายุน้อยจะ "บ่น" ในสื่อสังคมออนไลน์มากกว่า ขณะที่บรรดาผู้อาวุโสมักจะกล่าวถึงเรื่องที่ "น่ายินดี" มากกว่า
งานวิจัยอีกชิ้นหนึ่งใช้ตัวอย่างคนมากยิ่งขึ้นไปอีกคือ 75,000 คน โดยวิเคราะห์คำ วลี หรือหัวข้อมากมายถึง 700 ล้านชุด !!!
การศึกษานี้ลงในวารสาร PLOS ONE ฉบับ 8(9) ของปี 2013 สรุปใจความเนื้อๆ ได้ว่า ดูแค่ตัวอักษรก็บอกตำแหน่งแห่งหนของคนโพสต์ได้
คือพบว่าคนที่อาศัยอยู่ที่สูง จะมีคำที่เกี่ยวข้องกับความสูงปนอยู่มากกว่าชัดเจน (เช่น คำว่าภูเขา) ส่วนพวกผู้ป่วยทางจิตประสาทก็โพสต์โดยใช้คำว่า "ป่วย" หรือ "(ซึม)เศร้า" บ่อยๆ
ส่วนการแสดงความเป็นเจ้าข้าวเจ้าของ หลายคนอาจจะเดาผิด เพราะผู้ชายมักใช้ "ของฉัน" คู่ไปกับคำว่า "แฟน" หรือ "ภรรยา" บ่อยกว่าที่ผู้หญิงใช้กับคำว่า "แฟน" หรือ "สามี" อย่างเห็นได้ชัด
Photo by Markus Spiske on Unsplash
ที่น่าสนใจคือ เดิมการวิเคราะห์แบบนี้เดิมจะใช้ "คำศัพท์แบบปิด (closed vocabulary)" คือ เลือกใช้คำจำเพาะเช่น คำว่า "กระตือรือร้น" หรือ "น่าทึ่ง" มาผูกกับ "ความสุข" ของตัวคนโพสต์ได้
แต่มีข้อจำกัดคือเป็นคำที่ต้องตั้งใจเลือกและมีชุดคำน้อย บางทีก็เลยก็ตกหล่นคำที่ข้างเคียงไป และปัญหาใหญ่ที่สุดคือ ใช้กับการวิเคราะห์คำศัพท์จำนวนมากๆ ไม่ค่อยได้
การทดลองนี้ใช้วิธีการแบบใหม่เรียกว่าการวิเคราะห์แบบ "คำศัพท์แบบเปิด (open vocabulary)" ที่แก้ปัญหาดังกล่าวข้างต้นได้ทั้งหมด โดยผนวกเข้ากับเทคนิคอีกแบบหนึ่งเรียกว่า ดีแอลเอ (DLA, Differential Language Analysis)
เมื่อใช้เทคนิคทั้งคู่ คณะนักวิจัยพบว่าสามารถ "ทำนาย" เพศของอาสาสมัครได้จากคำที่ใช้ แม้ว่าจะไม่มีคำบ่งเพศ (เช่น คะหรือครับ) ในภาษาอังกฤษแบบเดียวกับในภาษาไทย
วิธีนี้แม่นยำถึง 92% ส่วนการทายอายุก็มีโอกาสมากกว่า 50 % ที่จะทายถูก (บวกลบแค่ 3 ปีเท่านั้น)
นอกจากจะใช้ทายลักษณะหลักๆ เช่น ความเป็นคนเปิดเผย ชอบเข้าสังคม ฯลฯ ได้แล้ว ยังมีความเป็นได้ในอนาคตที่จะพัฒนาต่อไปให้ทำนายลักษณะทางอารมณ์หรือความเจ็บป่วย เช่น ซึมเศร้า ที่ตอนนี้ยังทำได้ไม่แม่นยำนัก
สมัยก่อนมีคำกล่าวที่ว่า "รู้หน้าไม่รู้ใจ" พอมาถึงยุคโซเชียลมีเดีย อาจจะต้องเปลี่ยนเป็น "เห็นแค่โพสต์ ก็รู้ลึกถึง(ข้างใน)ใจ" แล้วละครับ !
บทความนี้รวมอยู่ในหนังสือ "อย่าชวนเธอไปดูหนังรัก", สนพ.มติชน
หน้าปกหนังสือ "อย่าชวนเธอไปดูหนังรัก", สนพ.มติชน, สอบถามเพิ่มเติมที่ https://www.facebook.com/matichonbook
โฆษณา