Sasaki Peter

pharmaceutical programmer

NGSについて

2019-02-04 Sasaki Peterbio-infomatics

バイオの世界に、次世代シーケンサ(Next Generation Sequencer: NGS)と言う機械がある。 これは生物の遺伝子の塩基配列を高速に読み出せる機械である。

遺伝子とは生物の細胞内の核に存在する染色体に点在している特定の領域のことで、ヒトには約2万個の遺伝子があるとされている。この染色体および遺伝子はヌクレオチドと呼ばれる物質が長く連なったものであり、ヌクレオチドはデオキシリボースという糖と塩基そしてリン酸からなる。さらに塩基には4種類あり、それぞれアデニン(A)、チミン(T)、グアニン(G)、シトシン(C)と言う。言い換えるとDNA1つ1つの違いは、この4種類の塩基のうち、どれが割り当てられているかと言うことでだいたい説明がつき、この塩基の配列の順番が分かればどのような遺伝子がコードされいるかが分かる。

NGSはこの塩基配列をズタズタに切断することで読み取ることができる。このNGSには大きく分けて2種類あり、約250塩基単位で塩基配列を読み取ることができるMiSeqなどのショートリードシーケンサーと、約10,000塩基単位で塩基配列を読み取ることができるロングリードシーケンサーがある。

ロングリードシーケンサーは大きな塩基配列の挿入、欠損や、父母2対ある染色体のうちどちらの親由来の配列なのか分かるなどのショートリードにはない特徴がある。

ロングリードシーケンサーは、主にillumina社とPacBio社の2社が開発している。

今後、ロングリードシーケンサーの出力結果を解析するという作業についての記事を数件書くことにする。