| 2 | 라이브러리 제작Library Preparation
가. 말단수리 - End Repair
분절화가 끝난 핵산은 말단 부위가 완전히 이중나선(duplex) 구조로 되어 있지 않는 경우가 많다. 이러한 불완전한 말단을 DNA 중합효소 등을 이용하여 절단해 내거나 상보적인 염기로 채워 끝까지 완전히 이중나선 구조가 되도록 만들어 준다. 이 때 5′-말단에 인산기를 추가로 붙여 준다.

나. 3′-말단 아데닌 추가 - A-tailing
말단 수리된 DNA의 3′-말단에는 효소를 이용하여 아데닌(adenine) 염기를 추가하여 주면 아데닌이 튀어나와 걸쳐있는(overhang)형태를 가지게 된다. 이러한 산물은 티민(thymine)이 걸쳐있는 어댑터(adapter) 올리고뉴클레오티드와 상보적으로 결합하기 쉽게 된다.

다. 어댑터 부착 - Adapter ligation
어댑터(Adapter)란 NGS 장비가 인식할 수 있는 고유한 염기서열을 가진 올리고뉴클레오티드로서, DNA에 어댑터를 붙여 주는 작업은 보통 리게이즈(ligase) 효소를 이용한다. 어댑터는 보통 Y자 형태(forked) 혹은 U자 형태(hairpin)로 되어 있고 3′-말단에는 티민이 붙어 있어 A-tailing 작업이 끝난 산물에 리게이즈 효소에 의해 쉽게 붙을 수 있도록 고안되어 있다.
어댑터에는 샘플을 구별할 수 있는 고유한 염기서열이 있으며 이것을 인덱스(index) 혹은 바코드 (barcode)라 부른다. 샘플 인덱스는 보통 수 개~수십 개 정도 되는 염기서열로 되어 있고 각 장비에서는 약속된 인덱스 염기서열을 판독한 후 해당 라이브러리 DNA가 어느 샘플에서 유래되었는지 분류할 수 있게 한다.


라. 라이브러리 증폭 - Library amplification
어댑터가 붙은 라이브러리는 엑솜(exome) 혹은 타겟 패널 시퀀싱을 하기에 양이 충분하지 않기 때문에 PCR 증폭 과정을 거친다. 여기엔 DNA 중합효소가 사용되며 DNA 복제 과정에서의 에러를 줄이기 위해 정확도가 높은(high-fidelity) 중합효소가 많이 사용된다.
마. 정제Clean-up 및 크기 선별 - size selection
라이브러리를 만드는 단계에서는 예기치 않은 부산물이 생성되며 여기에는 프라이머끼리 비특이적으로 붙는 다이머(dimer) 등이 포함된다. 이러한 부산물은 NGS 분석에 문제를 일으키기 때문에 제거해 주어야 하며, 보통 특정 크기의 DNA를 특이적으로 제거하는 자성 비드(magnetic bead)를 사용하거나 전기영동을 통한 제거 방식을 이용한다.
| 3 | 자동화 장비 - Automated instruments
라이브러리 제작 단계나 표적 선별 단계가 복잡하기 때문에 이를 자동화한 장비들이 출시되고 있다. 써모사이언티픽 사에서는 PCR 증폭부터 라이브러리 제작까지 한 장비 안에서 자동으로 진행되는 Ion Chef 장비를 출시하여 Ion S5 NGS System 장비에 보조적으로 사용할 수 있도록 하고 있다. 그 이외에 NGS STAR for library prep(Hamilton 사), Sciclone NGS Workstation(Perkin Elmer 사) 등 자동 파이펫팅 기능을 갖춘 여러 장비들이 출시되고 있다.
4. 타겟 선별 - Target enrichment
타겟 선별(Target enrichment)은 원하는 부위를 PCR 프라이머(primer)로 증폭을 하는 앰플리콘(amplicon) 방법과 프로브(probe)를 이용하여 교합(hybridization)하는 캡쳐(capture)방법으로 나뉜다. PCR 앰플리콘 방식은 검사 소요시간이 더 짧고, 상대적으로 적은 양의 DNA를 필요로 하여 잘 디자인된 작은 수의 유전자 패널에 대한 검사에 유용하지만, 패널의 유전자 수가 많아지거나 엑솜 시퀀싱(exome sequencing)을 수행하는 경우에는 효과적이지 못하다. 또한 PCR을 기반으로 한 검사는 PCR 증폭에서 생길 수 있는 편향(bias)과 오류(error)의 영향을 받아 타겟 부위 별로 균일하게 증폭되지 못하는 제한점이 있다. 또한 forward 및 reverse 프라이머 사이에 위치한 부위만 증폭이 가능하기 때문에 긴 부위를 검사할 때는 프라이머를 고안하는데 유연성이 떨어진다. 유전자 수가 많아지면 간섭 효과가 적은 캡쳐 방식이 유리하지만 필요한 DNA 양과 검사 비용이 증가할 수 있는 단점이 있다.
DNA 시퀀싱은 타겟의 범위에 따라 타겟 패널 시퀀싱(targeted panel sequencing), 엑솜 시퀀싱(whole exome sequencing) 및 전장 유전체 시퀀싱(whole genome sequencing)으로 나뉠 수 있다. 만들어진 라이브러리를 추가 작업 없이 NGS 분석을 하여 모든 DNA의 데이터를 얻는 것을 whole genome sequencing(WGS)이라 하고, 모든 RNA의 정보를 분석하면 whole RNA sequencing이 된다. 원하는 유전자 부위만 보고자 한다면 분석하고자 하는 부분의 DNA 혹은 RNA를 선별해야 하며 이것을 타겟 선별(target enrichment)이라 하고 이렇게 NGS 분석을 하는 것을 targeted sequencing이라 부른다.

출처: 식품의약품안전처 식품의약품안전평가원 - 차세대염기서열분석 해설서
'[분자생물학] NGS' 카테고리의 다른 글
NGS(Next Generation Sequencing) 기반 유전자 검사의 이해 - 심화용 (5) (0) | 2022.08.09 |
---|---|
NGS(Next Generation Sequencing) 기반 유전자 검사의 이해 - 심화용 (4) (0) | 2022.08.09 |
NGS(Next Generation Sequencing) 기반 유전자 검사의 이해 - 심화용 (2) (0) | 2022.08.09 |
NGS(Next Generation Sequencing) 기반 유전자 검사의 이해 - 심화용 (1) (0) | 2022.08.09 |
NGS(Next Generation Sequencing) 기반 유전자 검사의 이해 - 입문용 (5) (0) | 2022.08.09 |