รหัสพันธุกรรมดีเอ็นเอ (DNA) ของมนุษย์ซึ่งเป็นการเรียงตัวของเบส A T C G กว่า 3 พันล้านตัวอักษร อยู่ในเซลล์แทบทุกเซลล์ แต่มีเพียงแค่ 1.5% ของดีเอ็นเอ (exon) เท่านั้น ที่สามารถถอดรหัสมาสร้างเป็นโปรตีนสำหรับใช้เป็นโครงสร้าง หรือใช้ในกระบวนการต่าง ๆ ของเซลล์