7 ก.ย. 2020 เวลา 16:39 • วิทยาศาสตร์ & เทคโนโลยี
Diffbot ว่าที่ AI อับดุล แห่งโลกอนาคต??
2
อยากรู้อะไร ถามได้ ตอบได้ และนี่คือ AI ที่อาจจะตอบได้ทุกคำถามที่คุณอยากรู้ ที่สำคัญคุยได้เกือบทุกภาษาที่มีบนโลกด้วย 😉
2
การสร้างภาพแห่งความจริงคือหัวใจของ AI แสนรู้ที่จะตอบได้ทุกอย่าง
โดยความรอบรู้ของมันมาจากการนั่งท่องเวปมันทั้งวันทั้งคืน และก็จะรู้มากขึ้นไปเรื่อย ๆ ตามข้อมูลที่ถูก Upload ขึ้นไปบนอินเตอร์เนต
ก่อนจะมาพูดถึง Diffbot เจ้า AI หัวเรื่องของวันนี้ ขอย้อนไปเมื่อช่วงเดือนกรกฏาคมที่ผ่านมา OpenAI’s language generator ที่ชื่อ GPT-3 ได้แสดงถึงความสามารถในการเขียนข้อความที่เหมือนกับว่าเขียนขึ้นด้วยคนจริง ๆ
ตัวอย่างบทความที่เขียนโดย GPT-3
หรือแม้แต่ความสามารถในการเติมคำในช่องว่าง หรือใส่ข้อมูลทางสถิติเข้าไปใน Excel
แสดงให้เห็นถึงความสามารถในการทำความเข้าใจโจทย์ที่ให้ไปและหาคำตอบออกมาที่ดูน่าประทับใจ
ตัวอย่างการใส่ข้อมูลโดยใช้ GPT-3
หากแต่ข้อมูลที่ได้มานั้นยังห่างไกลคำว่า AI อัจฉริยะ อยู่เพราะข้อมูลที่ GPT-3 ตอบมามันไม่ถูกครับ
ซึ่งคงคล้ายกับการที่นกแก้วเลียนเสียงพูดของเราได้ แต่ไม่รู้ความหมายของมัน บางที GPT-3 อาจเหมาะกับการเขียนนิยายแฟนตาซีที่ไม่ต้องอ้างอิงความจริงใดในโลก
ดังนั้นหากเราจะเชื่อใจข้อมูลที่ AI ตอบออกมานั้นสิ่งแรกที่ต้องพึงระลึกไว้ คือเจ้า AI นี้มันเชื่อถือได้มั้ย แม้จะถามคำถามก็ต้องถามให้ถูกคนเราถึงจะได้คำตอบที่ถูกต้องใช่ไหมละ
Diffbot นั้นจึงมีแนวคิดในการพัฒนาที่ตางออกไป คำถามคือจะฝึกให้มันแยกแยะความจริงได้อย่างไร??
วิธีการก็คือให้เจ้า Diffbot นั่นเข้าไปนั่งอ่านเวปทุกหน้าที่มี อ่านมันทุกภาษา และดึงเอาข้อมูลออกมา ก่อนจะแยกแยะว่าความจริงคืออย่างไหน
วิธีการฝึกให้เรียนรู้ความจริงในโลกก็คือนั่งท่องเวปมันเข้าไป
โดยหลักการส่วนแรกจะคล้ายกับ GPT-3 ในการสูบข้อมูลงานเขียนต่าง ๆ ที่มีอยู่ในอินเตอร์เนต แต่ต่างกันที่ข้อมูลเหล่านี้ไม่ได้เอาไปฝึก Diffbot เพื่อการเขียนข้อความที่ดูคล้ายว่าคนเขียน หากแต่เอาข้อมูลเหล่านี้ไปแยกแยะความจริง
* * แล้วจะแยกแยะข้อมูลได้ยังไงว่าอันไหนถูก? * *
เจ้า Diffbot จะสแกนข้อความและภาพก่อนจะแบ่งแยกเป็น 3 กลุ่มข้อมูลความจริงที่เชื่อมโยงกันคือ ประธาน กิริยา และกรรม (subject, verb, object)
มันก็เหมือนกันรูปแบบมาตราฐานในการสร้างประโยค นั่นคือต้องมีส่วนประธานทำอะไรกับใคร ตัวอย่างเช่น "พี่เบิร์ด ธงไชย" เป็น "นักร้อง" ซึ่งข้อมูลความจริง 3 กลุ่มที่โยงใยกันเป็นโครงข่ายนับล้าน ๆ นี้มันคือสิ่งที่เรียกว่า "knowledge graph"
ข้อมูลความจริงที่ถูกโยงใยกันไม่รู้จบสิ้น นี้แหละคือ knowledge graph
knowledge graph นี้ไม่ใช่เรื่องใหม่ในวงการ AI มันถูกพัฒนาขึ้นมาเป็นสิบปีแล้ว แต่ความยากคือการใส่ข้อมูลเข้าไปให้ครบถ้วนต่างหาก
1
เพราะการคอยป้อนข้อมูลด้วยคนนั้น ทำกันชาตินี้ก็ไม่มีวันหมด แถมในทุกวันนี้ก็มีข้อมูลใหม่ที่ไหลบ่าเข้าท่วมอินเตอร์เนต
ตัวอย่างการใช้ knowledge graph ก็เช่น Google ที่ปัจจุบันที่เมื่อเรา Search หาข้อมูลดารา นักร้องบางคน ก็จะมีสรุปข้อมูลชีวประวัติให้เสร็จสรรพ
โปรไฟล์มาพร้อมเสิร์ฟ
แต่ข้อมูลนี้ Google ทำไว้เฉพาะกับบุคคลสาธารณะที่เป็นที่สนใจในการค้นหาของผู้คน แต่กับ Diffbot นั้นเก็บหมดทุกข้อมูลที่มีในสารบบ ซึ่งนั่นจะทำให้ Diffbot มี knowledge graph ใหญ่ที่สุดเท่าที่เคยมีมา
และการจะทำ knowledge graph ที่รู้ทุกอย่างในเวปนั้นไม่มีทางทำได้หากไม่ใช้ระบบอัติโนมัติอย่าง Diffbot ที่นั่งอ่านเวปทั้งวันทั้งคืนด้วยความไวแสง
การจะทำแบบนี้ได้ Diffbot จึงต้องใช้ Chrome browser เวอร์ชั่นพิเศษที่เรียกว่า super-charged version
Diffbot จะอ่านเวปด้วยการมองเป็นภาพ Pixel ก่อนใช้ image-recognition algorithms ในการแปลงและจัดแยกประเภทข้อมูลเป็น 1 ใน 20 หมวด เช่น หมวดวีดีโอ รูปภาพ กระทู้พูดคุย บทความ เป็นต้น
หลังจากนั้นก็ย่อยข้อมูลด้วยกระบวนการวิเคราะห์ ประธาน-กิริยา-กรรม โดยใช้ NLP ก่อนนำไปใส่เพิ่มใน knowledge graph
NLP หรือ Neuro Linquistic Programming คือ กระบวนการทำความเข้าใจความจริงที่ Diffbot ใช้
ทั้งนี้ Diffbot ต้องเรียนรู้ที่จะเลื่อนหน้าเวป กดสลับ Tab หรือคอยปิด Pop-up ที่เด้งมาบัง และมันทำอย่างนี้ทั้งวันทั้งคืนไม่มีหยุดพักซึ่งจะทำการ Update ข้อมูล knowledge graph ทุก รอบ 4-5 วัน
โดยในแต่ละเดือนนั้นจะมีข้อมูล บุคคล กิจการ สินค้า ใหม่ ๆ เพิ่มเข้ามาในอินเตอร์เนตประมาณ 100-150 ล้านเรื่อง ซึ่งทำให้ต้องมีการรวมข้อมูลใหม่เข้ากับข้อมูลเก่าหรือต้องเลือกว่าข้อมูลไหนที่ล้าสมัยใช้การไม่ได้
นั่นทำให้ต้องมีการเพิ่มอัลกอริทึ่มใหม่ ๆ รวมถึง Hardware ให้กับ Diffbot ไปเรื่อย ๆ ตาม knowledge graph ที่เติบโตขึ้นทุกวัน
ทั้งนี้นักพัฒนา AI สามารถเข้าถึง Diffbot ได้โดยไม่มีค่าใช้จ่าย แต่หากกิจการต้องการนำ Diffbot ไปใช้งานนั้นจะมีค่าใช้จ่าย โดยปัจจุบัน Diffbot มีลูกค้าใช้งานอยู่กว่า 400 รายจากทั่วโลก
ค่าบริการแต่ละแพคเกจ
ซึ่งแต่ละกิจการก็มีจุดประสงค์การใช้งานแตกต่างกันไป เช่น Snapchat ใช้ดึงหัวข้อข่าวใหม่ ๆ ที่เกิดขึ้นในแต่ละวัน, NASDAQ ใช้ข้อมูลไปทำการวิเคราะห์ทางการเงิน
และตัวอย่างการใช้งานที่ Diffbot ช่วยกิจการได้มาก เช่น ใช้ในการหาเวปขายของก๊อป ซึ่งถ้าหาก Search หาปกติจะหายากมาก เพราะขนาดหาเจาะว่าจะซื้อของที่ต้องการแล้วก็ยังมีผลการค้นหาที่ไม่ใช่เวปขายของปลอมโผล่มา
แต่ทั้งนี้การใช้งาน Diffbot ก็ยังไม่ง่าย ปัจจุบันต้องคุยกับ AI ตัวนี้ผ่าน Code ยังไม่มี User Interface สำหรับผู้ใช้งานทั่วไปที่จะป้อนคำถามกับ Diffbot ได้โดยตรง
ซึ่งทางบริษัทมีแผนพัฒนาต่อไปเพื่อให้ Diffbot เป็น AI ที่สามารถตอบได้เกือบทุกคำถามในทุกภาษาที่ลูกค้าต้องการรู้
ด้วยการผสมผสานการใช้ language models เพื่อให้ AI สื่อสารได้เหมือนมนุษย์ และ knowledge graph น่าจะทำให้ Diffbot เป็น AI ที่ฉลาดและคุยรู้เรื่องสำนวนไม่แปร่ง
แต่ก็อย่าลืมว่ายังมีความรู้ ความจริง อีกมากมายที่ไม่ได้อยู่บนโลกอินเตอร์เนต ความรู้เหล่านี้ AI จะรับรู้ได้อย่างไร?? และภาษาที่มีแต่ภาษาพูดละ AI จะสื่อสารและรับรู้ข้อมูลได้ยังไง?
1
แน่นอนว่า Diffbot วันนี้ยังคงห่างไกลการเป็นอับดุล AI แต่ไม่แน่ในช่วงชีวิตเราอาจได้เห็น AI แสนรู้ขนาดนั้นก็เป็นได้ 🤔😉

ดูเพิ่มเติมในซีรีส์

โฆษณา