NGS란?
서론
이번 게시글에서는 Next Generation Sequencing (NGS)가 무엇인지에 대해 알아보도록 하겠습니다.
NGS는 한국어로 해석하면 차세대 염기서열 분석법이라고 부릅니다. 물론 현재는 차세대라고 하기에는 좀 그렇습니다.
이 기술은 2000년대 후반에서 2010년대로 넘어갈 때 개발되었는데, 이 전의 경우, 시퀀싱 방법은 Sanger sequencing을 이용하여 염기 서열을 읽었으나, 2000년대 후반에 NGS가 개발되면서 Sanger sequencing과는 비교할 수 없을 정도로 빠른속도로 많은 염기서열을 읽을 수 있게 되면서, 생물정보학이나 생물학에서의 새로운 발견에 큰 도움이 되었습니다.
NGS란?
이제부터는 NGS가 무엇인지, 어떤 방식으로 시퀀싱이 되는지에 대해서 알아보도록 하겠습니다.
일단 NGS 역시 시퀀싱 방법이므로
1. 혈액 샘플이 준비되어야 합니다.
2. 혈액샘플을 원심분리기 (Centrifuge) 에 집어 넣어서, 연구 목적에 따라서 DNA 혹은 RNA를 분리해냅니다.
3. 여기에선 RNA라고 가정해보겠습니다. 원심분리기에서 나온 RNA는 엄청 길죠. 일반적으로 인간 DNA의 경우에는 30억bp가 됩니다.
위 그림은 대표적인 시퀀서 중 하나인 Ilumina 사의 NextSeq 500 시퀀서입니다. 이 시퀀서에 원심분리기에서 나온 RNA 혹은 DNA를 집어 넣으면, 시퀀싱을 진행하게 됩니다.
하지만, 여기서 중요한 점은 30억 bp 정도 되는 염기서열을 시퀀서에 한꺼번에 넣으면 시퀀서에 무리가 가면서 제대로된 시퀀싱이 이뤄지지 않습니다.
그래서 그림 1번의 3번째 단계처럼 긴 염기서열을 Fragmentation을 합니다. 즉 랜덤한 길이로 짜릅니다.
그럼 엄청 많은수의 조각들이 많들어지겠죠? 이렇게 나눠진 Fragment에서 특정 길이에 해당되는 Fragment들만 시퀀서에 집어넣게 됩니다.
그림 1번의 4번째 단계를 보면 Fragment의 양 옆에 무엇인가 짧은 조각들이 붙어 있습니다. 이 짧은 서열들을 Adapter sequence라고 합니다. 이 어댑터 시퀀스들은 염기서열에 대한 정보를 시퀀서 안에서 다루기 위해서 이용됩니다.
그러면 시퀀서 안에서 어댑터 시퀀스는 자연스럽게 제거가 되어야겠죠? 또한, 어댑터가 추가된 Fragment가 만약 RNA라면 RNA의 경우에는 단일 가닥이기 때문에 불안정합니다. 그래서 대부분의 Library를 준비하는 과정에서 cDNA로 역전사를 진행한 후에, 시퀀서에 집어 넣어 염기서열을 읽는 과정을 거칩니다.
지금까지의 과정을 간략하게 설명하면 다음과 같습니다.
1. 샘플준비
2. DNA 혹은 RNA 추출
3. Fragmentation
4. Adapter ligation
5. RNA의 경우 cDNA로 역전사
6. 시퀀서에 집어 넣는다.
이렇게 단계로 보면 간단합니다. 하지만 2-4번의 경우는 Library prepration 과정이라고 하는데, 이 과정은 시퀀싱 업체에 따라서 다양하기도 하고 좀 더 구체적으로 들어가면 생물학적인 내용이 많이 들어갑니다.
일단 이번 게시글에서 가장 중요한 점은 NGS의 핵심 아이디어는 Fragment 이며, 기존의 Sanger sequencing보다 훨씬 빠르고 많은 양의 염기서열을 읽어 낼 수 있고, 가격 또한 요즘은 많이 저렴해진 편에 속합니다.
이렇게 시퀀서를 통해서 읽었으면, 이를 인간이 이해할 수 있는 문자로 저장해야겠죠? 이게 이전 게시글에서 봤었던 FASTQ파일입니다.
아래 영상과 함께 보시면 도움이 될 것 같습니다!
'공부 > 바이오인포매틱스' 카테고리의 다른 글
RNA-Sequencing 분석 파이프라인을 알아보자 (0) | 2022.09.11 |
---|---|
Parallel-fastq-dump 설치하기 (0) | 2022.09.08 |
시퀀싱이란? (0) | 2021.10.11 |
[바이오인포매틱스] Annotation 파일 다운받기 (0) | 2021.10.06 |
[바이오인포매틱스] Fastq 파일형식 (0) | 2021.10.06 |
댓글