25 ธ.ค. 2021 เวลา 09:02 • วิทยาศาสตร์ & เทคโนโลยี
สรุปจาก Clubhouse รวยด้วย SynBio EP10: Designer Protein (Part 1)
1
1. Clubhouse ตอนนี้ว่าด้วยการม้วนพับและวิศวกรรมโปรตีน โดยมีแขกรับเชิญ 3 ท่านคือ อ.ป๋วย (ผศ.ดร. ป๋วย อุ่นใจ) ผู้มีประสบการณ์ด้านการหาโครงสร้างโปรตีนด้วยเทคนิค cryo-EM อ.เปา (ดร. บุญฤทธิ์ เมฆศิริพร) นักวิจัยด้านการทำ directed evolution และอาร์ต (จิรเมธ คิญชกวัฒน์) นักวิจัยสาย machine learning ในชีววิทยา และระหว่างรายการเราก็ได้อ.ปั้น (ดร. กิตติคุณ วังกานนท์) มาให้ข้อมูลเสริมหลายส่วน โดยเฉพาะการทำ x-ray crystallography เพื่อหาโครงสร้างโปรตีน
2. โปรตีนเป็นสารที่เกิดจากการนำกรดอะมิโน 20 แบบมาเรียงต่อกันเหมือนกับการร้อยลูกปัด 20 สี ราวกับเวทย์มนตร์ ลำดับเหล่านั้นจะเป็นตัวบ่งชี้ว่าโปรตีนควรม้วนพับเป็นรูปร่างหน้าตาแบบไหน บางทีโครงสร้างที่เกิดขึ้นก็เป็นร่องที่จับกับสารบางตัวได้พอดิบพอดี หรือมีการวางตัวกรดอะมิโนไว้พร้อมจู่โจมสารเป้าหมาย ความแตกต่างในโครงสร้างสามมิติเหล่านี้แหละที่ส่งให้โปรตีนแต่ละตัวมีหน้าที่แตกต่างกันออกไป (sequence -> structure -> function)
3. วิศวกรรมโปรตีน (Protein Engineering) เป็นศาสตร์ของการสร้างโปรตีนที่ไม่เคยมีอยู่ในธรรมชาติ ถ้ามองถึงประโยชน์ในเชิงอุตสาหกรรม เราก็อาจจะวิศวกรรมให้เอนไซม์ทำงานได้เร็วขึ้น ทนความร้อนมากขึ้น หรืออาจจะทำให้เอนไซม์ทำปฎิกิริยาใหม่ๆ ที่ไม่เคยมีอยู่ในธรรมชาติเลยก็ได้ โดยแนวทางการวิศวกรรมโปรตีนจะแบ่งกว้างๆ ได้ 2 ประเภทคือ 1. อัพเกรดโปรตีนที่มีอยู่ในธรรมชาติ 2. ออกแบบโดยไม่ลอกการบ้านพระเจ้า (de novo design)
4. การอัพเกรดโปรตีนที่มีอยู่ในธรรมชาติก็ยังสามารถแบ่งย่อยได้อีกสองแบบคือ 1. rational design ที่เริ่มจากการดูโครงสร้างสามมิติของโปรตีนแล้วคิดว่าถ้าเราปรับเปลี่ยนกรดอะมิโนตรงตำแหน่ง xxx แล้วมันน่าจะให้ผลลัพธ์ที่เราต้องการได้เพราะ xxx 2. directed evolution คือใช้วิธีการบางอย่างที่ทำให้เราสามารถผลิตโปรตีนที่มีลำดับกรดอะมิโนมั่วๆ ได้ จำนวนมาก หลังจากนั้นก็ทำการคัดเลือกว่าโปรตีนตัวไหนที่ให้ผลลัพธ์ดี แล้วผลิตโปรตีนมั่วๆอีกรอบ โดยใช้พวกที่ให้ผลดีในรอบแรกเป็นต้นแบบ หลังจากนั้นก็คัดเลือก ทำเป็นวัฏจักรวนไปเรื่อยๆ
เปรียบเทียบการทำ rational design กับการทำ directed evolution
5. อ.เปายกตัวอย่างงานที่อ.ทำ directed evolution เพื่อวิศวกรรมแอนติบอดี (antibody engineering) งานนี้เริ่มจากสร้างไลบรารี่ (โปรตีนที่ถูกดัดแปลงปนๆ กันไปหลายเวอร์ชันเหมือนกับหนังสือบนชั้นในห้องสมุด) ของแอนติบอดีด้วยเทคนิค error-prone PCR* พอแบคทีเรียสร้างแอนติบอดีออกมาได้แล้ว ระบบคัดสรรที่นำประสิทธิภาพของแอนติบอดีมาผูกเข้ากับชีวิตของแบคทีเรีย E.coli ก็จะเริ่มทำงาน ถ้าเซลล์ไหนโชคดี แอนติบอดีที่สร้างได้มีการพัฒนาดีขึ้น E.coli จะมีชีวิตรอด แต่ถ้าหากโปรตีนที่ได้แย่ลง E.coli ที่เลี้ยงไว้ก็จะตาย (นี่มัน squid game เวอร์ชันแบคทีเรียชัดๆ) ตอนนี้อ.เปาก็กำลังมีงานพัฒนาแอนติบอดีที่จับกับไวรัสก่อโรค African swine flu ในหมูร่วมกับอ.ป๋วย
*ปกติ PCR จะเอาไว้ปั๊มดีเอ็นเอหน้าตาเหมือนกันออกมาเยอะๆ แต่ถ้าเราเปลี่ยนเลือกใช้เอนไซม์ที่ถูกดัดแปลงให้หยิบชิ้นส่วนมั่วๆ เก่ง (เปลี่ยน bug เป็น function ไปเลย) เราก็จะสามารถเอ็นเอลำดับแปลกๆ ที่เซลล์แบคทีเรียจะเอาไปใช้แปลงเป็นแอนติบอดีแปลกๆ จำนวนมากออกมาแทน
อาจารย์ป๋วยทำงานเกี่ยวกับโครงสร้างโปรตีนเป็นหลัก แต่พอกลับมาไทยเคยถูกเรียกให้ไปสอนวิชาสัตว์ไม่มีกระดูกสันหลัง เลยหันมาทำโปรเจคต์เกี่ยวกับหนอนตัวแบนด้วย ตอนนี้กำลังศึกษาผลของ microenvironment ต่อการเจริญเติบโตของสเต็มเซลล์ในหนอนตัวแบน สภาพแล็บเลยมีความชีวเคมีเยอะหน่อย โปรตีนที่อ.ป๋วยสนใจจะเป็นกลุ่มโปรตีนที่จับกับ microtubule โดยเฉพาะกลุ่มที่ทำหน้าที่ขนส่งสารเข้าไปใน cilia และหางสเปิร์ม อีกพวกที่สนใจคือโปรตีนจากไวรัสก่อโรค
งาน motor protein ของอ.ป๋วย
กว่าจะเป็น… โครงสร้างโปรตีน
7. วิธีการศึกษาโครงสร้างโปรตีนหลักๆ แล้วจะมีอยู่ 3 วิธี
7.1 x-ray crystallography ตกผลึกโปรตีนแล้วนำไปส่องแสง x-ray แล้วแปลงผล x-ray diffraction ที่เป็นจุดกลมๆ จำนวนมากกลับไปเป็นโครงสร้างสามมิติ ความรันทดจะอยู่ที่การตกผลึกโปรตีน และมีข้อจำกัดเวลาทำกับโปรตีนตัวใหญ่ๆ ที่เวลาวิเคราะห์ข้อมูลจากผล x-ray diffraction จะยากเพราะจุดที่เห็นจะมีขนาดเล็กและอยู่ชิดกันมาก
ขั้นตอนการหาโครงสร้างโปรตีนด้วยวิธี x-ray crystallography
7.2 NMR เอาไว้ศึกษาโปรตีนตัวเล็กๆ ได้ แต่ถ้าโปรตีนตัวใหญ่เกิน ผลจะเละจนเริ่มอ่านไม่รู้เรื่อง แต่ก็ยังมีข้อดีอยู่ที่ว่าเราสามารถเก็บข้อมูลโปรตีนในสภาวะของเหลวได้ จึงนิยมเอามาใช้ศึกษาการปฏิสัมพันธ์กันของโปรตีน (protein-protein interaction)
7.3 Cryo-EM ใช้กล้องถ่ายรูปลำแสงอิเล็กตรอนแทนแสงในการบันทึกภาพหลายๆ มุมมาประกอบเป็นโครงสร้างสามมิติ ในปี 2013 ได้เกิดการปฎิวัติวงการ cryo-EM ขึ้นหลังจากที่มีคนคิดค้นตัวตรวจจับสัญญาณที่มีความไวสูง ทำให้ภาพที่ได้มีความคมชัดสูงขึ้นและมีคุณภาพใกล้เคียงกับภาพที่ได้จากการทำ x-ray crystallography ข้อดีคือไม่ต้องเสียเวลาตกผลึก และที่ต่างจากเทคนิคการหาโครงสร้างอย่างอื่นคือยิ่งโปรตีนตัวใหญ่ จะยิ่งหาโครงสร้างได้ง่าย
“สเกลขนาดคือ cryo-EM มันจะไม่ค่อยเหมือนชาวบ้าน คนอื่นเขาจะชอบตัวเล็กๆ จะได้ solve (หาโครสร้าง) ง่ายๆ แต่ตัว cryo-EM มันจะชอบตัวใหญ่ๆ ควายๆ ยิ่งใหญ่ยิ่งดี”
วิธีการหาโครงสร้างโปรตีนด้วยการทำ cryo-EM
8. ตกผลึกมันยากขนาดไหน? ขั้นแรกคือเราต้องมีโปรตีนบริสุทธิ์ปริมาณเยอะๆ ก่อนถึงจะเอามาทำผลึกได้ แต่ในขั้นนี้ บางทีโปรตีนก็ดันเกาะกลุ่มเป็นโครงสร้างไร้ระเบียบ ถ้ารอดไปถึงการตกผลึก ข่าวร้ายคือในปัจจุบัน การตกผลึกยังคงเป็นศาสตร์ลี้ลับที่ไม่มีใครหากฏเกณฑ์ตายตัวได้ เลยต้องเริ่มด้วยการ screen หาสภาวะที่โปรตีนจะตกผลึกได้จากระบบที่มีเกลือ, precipitant, pH แตกต่างกันนับร้อยแบบ ถ้าพอมีสภาพที่เกิดผลึกได้ ก็ลองปรับสภาพเพิ่มเติมเพื่อให้ได้ผลึกสวยๆ แต่พอได้ผลึกมาแล้ว บางทีผลึกดัน diffract แสงได้ไม่ดี ได้โครงสร้างไม่คมชัดพอก็ต้องกลับไปเริ่มใหม่อีก
แนะนำ Naturally Obsessed: The Making of A Scientist สารคดีตามติดชีวิตนักศึกษาในแล็บ crystallography
ทำนายโครงสร้างโปรตีนด้วย AlphaFold
9. ในปี 1963 การทดลองของ Christian Anfinsen ได้ชี้ให้เห็นว่าโครงสร้างสามมิติของโปรตีนถูกกำหนดไว้แล้วด้วยตัวลำดับกรดอะมิโน ดังนั้น แค่รู้ลำดับกรดอะมิโนอย่างเดียว มันก็ควรจะเพียงพอสำหรับการทำนายโครงสร้างโปรตีน และเกิดเป็น protein folding problem ที่รอให้นักวิทยาศาสตร์หาคำตอบมานานกว่า 50 ปี
10. ด้วยความหวังที่อยากให้เห็นปัญหานี้แก้ได้เร็วๆ เลยมีคนจัดงาน CASP ซึ่งเป็นการแข่งขันเพื่อทำนายโครงสร้างโปรตีนขึ้นมาขึ้นมา แต่ละแล็บที่เข้าร่วมก็จะได้ลำดับกรดอะมิโนของโปรตีนมาแล้วใช้อัลกอริธึมของตัวเองทำนายโครงสร้างสามมิติ เพื่อความยุติธรรม โปรตีนที่ใช้ในการแข่งขันจะเป็นตัวที่รู้โครงสร้างจากการทดลองอยู่แล้ว แต่ยังไม่ได้ตีพิมพ์ออกมา แล็บไหนที่ได้เหมือนสุดก็ชนะไป และหลังจากที่แข่งเสร็จ แต่ละแล็บก็จะมาแชร์เคล็ดลับกันว่าตนใช้วิธีอะไรมาทำนาย สาขานี้มันจะได้ก้าวหน้าเร็วขึ้น
11. CASP จัดขึ้นทุกๆ 2 ปี และครั้งล่าสุดตอนปี 2020 Deepmind ก็ได้กลายเป็นผู้ชนะการแข่งขัน CASP อีกครั้ง หลังจากชนะเลิศตั้งแต่ตอนเข้าร่วมครั้งแรกในปี 2018 แต่ในครั้งนี้ AlphaFold ทำคะแนนนำทีมคู่แข่งขาดลอย และผลการทำนายก็ดีพอๆ กับการหาโครงสร้างด้วยการทดลองจริง
เกณฑ์คะแนนที่สำคัญในการแข่งขัน CASP คือคะแนน global distance test (GDT) ถ้าได้เกิน 90 คะแนนก็แปลว่าโมเดลทำนายผลได้คุณภาพใกล้เคียงกับการทดลองในห้องแล็บ (ซ้าย) ผลการทำนายด้วย AlphaFold เทียบกับผลการทดลองจริงมีรูปแบบที่ใกล้เคียงกันอย่างมาก (ขวา)
12. Deepmind เป็นบริษัทลูกของกูเกิลที่เคยโด่งดังจากการทำ AlphaGo ล้มแชมป์โกะโลก 18 สมัยมาแล้ว หรือถ้าใครคุ้นเคยกับ StarCraft เกมวางแผนทางการทหารแบบ real-time AlphaStar ของบริษัทนี้ก็เคยเอาชนะทีมระดับโลกแบบขาดลอยมาแล้วเช่นเดียวกัน
การแข่งขันหมากล้อมระหว่าง AlphaGo กับ อีเซดล แชมป์โลกชาวเกาหลีใต้ในปี 2016
13. Deepmind ไม่ได้สร้าง AI ขึ้นมาเพื่อทำให้คนหมดสนุกกับเกมพวกนี้ แต่พวกเขามองว่าเกมเป็นตัวทดสอบระดับความสามารถของ AI ที่ดี และเป้าหมายจริงๆ ของบริษัทก็คือการนำ AI มาใช้แก้ปัญหาในโลกแห่งความเป็นจริง นอกจาก AlphaFold ที่ออกมาเพื่อทำนายโครงสร้างโปรตีน ช่วงปีที่ผ่านมาก็ยังมี DGMR ที่สามารถทำนายเรื่องของตำแหน่งและความแรงของฝนในอีกหนึ่งชั่วโมงข้างหน้าได้อย่างแม่นยำ ในสายชีววิทยาก็ยังมี Enformer ที่เอามาทำนายการแสดงออกของยีนโดยดูจากลำดับดีเอ็นเอ
14. เกิดดราม่าหลังการแข่งขัน CASP เมื่อ Deepmind ไม่ยอมเผยรายละเอียดเชิงลึกของ AlphaFold มีเพียงแค่คำสัญญาว่าจะมีการดีพิมพ์เปเปอร์ออกมาในภายหลัง ทำให้คนในวงการโมโหกันเป็นแถบ เพราะมันทำให้วงการชะงักงันและไปต่อไม่ได้ แต่ก็มีคนในกลุ่มของ David Baker ที่ได้อันดับสองในการแข่งขัน (และเคยได้อันดับต้นๆ มาหลายครั้งก่อนจะโดน AlphaFold ทิ้งห่างไป) ไม่ยอมแพ้และพยายามไล่แกะอัลกอริธึมของ AlphaFold จนสร้าง RoseTTAFold ที่ทำงานได้ดีพอๆ กับ AlphaFold ออกมาได้ เพื่อให้วงการยังก้าวหน้าต่อไปได้แม้ว่า Deepmind จะไม่ยอมปล่อยโค้ดออกมา
15. สุดท้ายทีม David Baker ก็ได้ตีพิมพ์เปเปอร์ของ RoseTTAFold ออกมาพร้อมแจกโค้ดเสร็จสรรพ ส่งแรงกดดันให้ในสัปดาห์เดียวกัน เปเปอร์ของ AlpfaFold ก็ถูกปล่อยออกมาและโค้ดของ AlphaFold ก็ถูกปล่อยออกสู่สาธารณะในที่สุด
RoseTTAFold ขึ้นปก Science ชนกับ AlphaFold ที่ขึ้นปก Nature
16. พี่ไอซ์เล่าให้ฟังว่าแล็บ David Baker เป็นแล็บใหญ่ที่ใหญ่สุดใน University of Washington ตอนที่เคยไป rotate มีนักเรียน ป. เอกอยู่เกือบ 50 คน (ตอนนี้ถ้ารวม postdocs และอื่นๆ ก็น่าจะเกือบ 150 คนไปแล้ว) ทำงานทั่งบนโต๊ะแล็บและบนหน้าจอคอม แนวงานหลักๆ ก็จะมี 2 แนวคือ การออกแบบโปรตีนใหม่ๆ (de novo protein design) กับการทำนายการม้วนพับของโปรตีน (prediction) ซึ่งทีมหลังจะเป็นทีมที่พัฒนาอัลกอริธึมเพื่อมาแข่งขันในงาน CASP นอกจากนี้ เกม Foldit ที่เป็นเกมพับโปรตีนก็เป็นผลงานจากแล็บนี้ด้วยเช่นเดียวกัน
David Baker เจ้าพ่อวงการ de novo protein design จาก University of Washington (ซ้าย) Foldit เกมที่ให้คนทั่วไปได้ลองพับโปรตีนเอง (ขวา)
17. แม้ว่า RoseTTAFold จะเป็นผลจากการพยายามวิศวกรรมย้อนกลับตัว AlphaFold แต่อาร์ตก็บอกว่าความซับซ้อนของโมเดล AlphaFold มีเยอะกว่าและต้องใช้พลังคอมพิวเตอร์ในการฝึกให้โมเดลเรียนรู้สูงกว่ามาก ซึงก็สะท้อนความจริงที่ว่ายังไง computational power ของแล็บมหาวิทยาลัยก็ไม่สามารถสู้กับ Deepmind ที่เข้าถึงทรัพยากรของกูเกิลได้
18. ในแง่ของข้อมูลที่ใช้ อาร์ตเสริมว่า AlphaFold มีการดึงข้อมูลลำดับกรดอะมิโนและโครงสร้างของโปรตีนที่มีความคล้ายคลึงกับโปรตีนเป้าหมายมาใช้งาน เช่นมีการใช้ข้อมูลวิวัฒนาการของลำดับกรดอะมิโนมาทำนายว่ากรดอะมิโนตัวไหนจะอยู่ดิดกันเมื่อโปรตีนมีการม้วนพับเกิดขึ้น
AlphaFold มีการนำลำดับกรดอะมิโนของโปรตีนเป้าหมายมาเทียบกับของโปรตีนที่มีลำดับกรดอะมิโนใกล้ๆ กันหลายๆ ตัวซึ่งมีข้อมูลของการวิวัฒนาการร่วมกันอยู่ คือถ้ากรดอะมิโนสองตัวในตำแหน่ง A และ B อยู่ติดกันในโครงสร้างสามมิติ เวลากรดอะมิโนตำแหน่ง A เปลี่ยนไป กรดอะมิโนตำแหน่ง B ก็จะเปลี่ยนตามไปด้วยเพื่อคงสภาพโครงสร้างสามมิติเอาไว้
19. ในแง่ของอัลกอรึธึม AlphaFold ก็ได้เอาแนวคิดเรื่อง attention จาก AI เพื่อการแปลภาษามาใช้งาน เพราะภาษาก็เหมือนกับลำดับกรดอะมิโนที่มีเรียงต่อกันไปเรื่อยๆ และบางครั้งมันก็มีจังหวะที่เราต้องนึกย้อนกลับไปถึงคำก่อนหน้าเพื่อจะเข้าใจความหมายของภาษา เช่น “AlphaFold ไม่ใช่ของง่าย แต่ถ้าอ่านสรุปนี้จบก็คงเข้าใจมันดีมากขึ้น” เราก็ต้องรู้ว่า”มัน” ในตัวอย่างคืออะไรถึงจะเข้าใจประโยคข้างต้น ในบริบทของโปรตีน การใช้ attention ก็ช่วยให้ AI สามารถเข้าใจความสัมพันธ์ระหว่างกรดอะมิโนที่อยู่ไกลกัน ซึ่งเป็นส่วนที่สำคัญสำหรับการพับเป็นรูปร่างสามมิติ
20. หลังจากการแข่งขัน CASP14 เริ่มมีคนพูดถึงสกิลแปลกๆ ของ AlphaFold ที่ไปไกลกว่าการทำนายโครงสร้างโปรตีน นั่นคือการทำนายได้ว่าเวลาโปรตีนหลายตัวมาประกอบร่างกัน (protein complex) มันจะจับกันตรงไหน จับกันยังไง และล่าสุดทีม David Baker ก็ได้ลองหาโปรตีนในยีสต์ที่จับกันได้กว่า 8.3 ล้านคู่ แล้วเลือกเอาพวกที่คิดว่าจะโมเดลได้แม่นๆ มาใช้ให้ RoseTTAFold และ AlphaFold ทำนายการประกอบร่างของโปรตีนจนสุดท้ายก็ได้โครงสร้าง protein complex ที่โลกไม่เคยเห็นมาก่อนนับร้อยอัน ครอบคลุมหลายกระบวนการสำคัญในเซลล์ เช่น การซ่อมแซมดีเอ็นเอ การสังเคราะห์โปรตีน
21. ความสามารถที่คาดไม่ถึงอีกอย่างของ AlphaFold คือการทำนายบริเวณของโปรตีนที่ไม่ได้ม้วนพับเป็นโครงสร้าง (disordered region) อันนี้จะเรียกว่าเป็นความโชคดีก็ได้เพราะมันมีเกณฑ์คะแนนที่ AlphaFold ใช้ประเมินว่ามันมั่นใจในตัวโครงสร้างโปรตีนที่ทำนายมามากแค่ไหน แล้วบริเวณที่มันบอกว่าไม่มั่นใจก็มักจะเป็น disordered region ซะงั้น
ตรงสีส้มที่ AlphaFold มั่นใจน้อยที่สุด อาจจะเป็น disordered region
22. พอ AlphaFold ทำนายโครงสร้างโปรตีนได้แม่นยำก็สามารถช่วยให้การหาโครงสร้างโปรตีนจากการทดลองง่ายขึ้นด้วย อย่างตอน CASP14 มีทีมผู้จัดงานที่เห็นว่า AlphaFold ทำงานดีมากจนสงสัย Deepmind โกงการแข่งขันรึเปล่า เพื่อขจัดข้อกังขา กรรมการคนนึงเลยลองให้ AlphaFold ทำนายโครงสร้างโปรตีนที่แล็บตัวเองแก้ไม่ได้เป็นสิบปีซะเลย (แก้ในที่นี้คือมีข้อมูลแล้วแต่ยังไขรหัสออกมาเป็นโครงสร้างไม่ได้ด้วยกระบวนการทางคณิตศาสตร์) ปรากฎว่าผลการทำนายของ AlphaFold ก็สอดคล้องกับผลการทดลองเป็นอย่างดี สุดท้ายเลยใช้วิธี molecular replacement จากโครงสร้างที่ AlphaFold ทำนายแก้ออกมาได้เป็นโครงสร้างโปรตีนตัวนั้นในที่สุด
ข้อจำกัดของ AlphaFold
23. เนื่องจากโปรตีนหนึ่งตัวสามารถมีได้มากกว่าหนึ่งโครงสร้าง บางทีเราก็ไม่อาจรู้ได้ว่าโครงสร้างที่ AlphaFold ให้มามันคือโครงสร้างตอนไหน ถ้าตอบแบบสั้นๆ ก็จะบอกว่ามันเรียนอะไรจากฐานข้อมูลมา มันก็จะตอบแบบนั้น กรณีหนึ่งที่คนพูดถึงคือมีโปรตีนหลายตัวที่เวลาอยู่เดี่ยวๆ ยังทำงานไม่ได้ก็มีโครงสร้างหนึ่ง พอไปจับกับไอออนโลหะหรือโมเลกุลบางตัวถึงจะเปลี่ยนรูปร่างแล้วทำงานได้ ประเด็นคือโครงสร้างแบบหลังมีความเสถียรมากกว่าและมักเป็นแบบที่ถูกบันทึกไว้ในฐานข้อมูลโครงสร้างโปรตีน ทำให้ผู้ใช้งานบางคนพบว่าทั้งๆ ที่ตัวเองใส่ข้อมูลลำดับกรดอะมิโนเข้าไปอย่างเดียว โครงสร้างที่ AlphaFold ทำนายมาให้ดันทำเสมือนว่าโปรตีนกำลังจับไอออนโลหะอยู่
24. ถึงแม้ว่าอัลกอริธึมจะทำนายโครงสร้างได้อย่างแม่นยำ AlphaFold ก็ยังไม่สามารถบอกเราได้ว่าโปรตีนม้วนพับจนกลายเป็นโครงสร้างที่มันทำนายออกมาได้ยังไง ดังนั้น เรายังพูดได้ไม่เต็มปากว่ามนุษย์สามารถแก้ protein folding problem ได้แล้ว
ฐานข้อมูลโปรตีนจาก AlphaFold
25. ในช่วงปี 2000s ที่โครงการจีโนมต่างๆ เริ่มผุดขึ้นมา เริ่มมีข้อมูลลำดับดีเอ็นเอออกมาอย่างมหาศาล ก็มีกลุ่มนักชีวะที่มีความฝันว่าอยากจะเห็นโครงสร้างโปรตีนทุกตัวในสิ่งมีชีวิตบ้างจนเกิดเป็น structural genomics movement แต่จากที่ได้บอกไปแล้วว่าการหาโครงสร้างโปรตีนไม่ใช่งานง่าย การตกผลึกโปรตีนก็เป็นเรื่องของโชคชะตา สิ่งที่คนกลุ่มที่พยายามทำจึงเป็นการผลิตข้อมูลโครงสร้างโปรตีนจากโปรตีนตัวไหนก็ตามที่ตกผลึกได้ แล้วนำข้อมูลไปฝากไว้ในธนาคารข้อมูลโปรตีน (Protein Data Bank) ซึ่งเป็นแหล่งข้อมูลสำคัญที่ได้นำมาใช้เป็นตัวอย่างในการสอน AlphaFold
26. หลังจากที่ Deepmind ปล่อยเปเปอร์ของ AlphaFold ได้หนึ่งสัปดาห์ ฐานข้อมูลโครงสร้างโปรตีนที่ใช้ AlphaFold ทำนายก็ถูกปล่อยออกมาผ่านความร่วมมือกับ EMBL-EBI (the European Molecular Biology Laboratory European Bioinformatics Institute) ในขณะที่หลายสิบปีที่ผ่านมา นักวิทยาศาสตร์ทดลองหาโครงสร้างอย่างยากลำบากมาได้เพียง 180,000 ตัว ในฐานข้อมูลนี้มีโครงสร้างโปรตีนอยู่ 350,000 ตัว ครอบคลุมโปรตีนจากมนุษย์และสิ่งมีชีวิตสำคัญอีก 20 ชนิด
27. ด้วย computational power ที่มีอยู่ Deepmind วางแผนที่จะใช้ AlphaFold ทำนายโครงสร้างโปรตีนในสิ่งมีชีวิตตัวอื่นๆ ที่มีกว่า 100 ล้านตัวให้ได้ทั้งหมดในปี 2022 ทว่า แม้แต่ในโปรตีนของมนุษย์ AlphaFold ก็ยังไม่สามารถทำนายโครงสร้างโปรตีนทั้งหมดได้เพราะมีโปรตีนกว่า 20% ที่ไม่ได้มีการม้วนพับเป็นโครงสร้างอะไร (disordered protein) หรืออาจจะยังไม่มีข้อมูลมากพอให้ AlphaFold เอามาเป็นพื้นฐานในการทำนายก็เป็นไปได้
ฐานข้อมูลโครงสร้างจาก AlphaFold: https://alphafold.ebi.ac.uk/
หน้าตาของ disordered protein ที่ไม่ได้ม้วนพับเป็นโครงสร้างอะไร
ข้อมูลเพิ่มเติม
ข่าว AlphaFold/RoseTTAFold
ข้อมูลเชิงลึกเกี่ยวกับ AlphaFold/RoseTTAFold
เปเปอร์ต้นทาง
- ฐานข้อมูลโครงสร้างโปรตีนจาก AlphaFold: https://www.nature.com/articles/s41586-021-03828-1
- ทำนายโครงสร้าง protein complex: https://pubmed.ncbi.nlm.nih.gov/34762488/
โฆษณา