ペアワイズ・アラインメント|【統計学・統計解析講義応用】
ペアワイズ・アラインメント
バイオインフォマティックすの領域における重要な手法の1つに、アミノ酸配列や塩基配列の整列(アラインメント)があります。
整列とは、比較する配列数によって、ペアワイズアラインメントとマルチプルアラインメントに区別されます。
2つの配列を比較する場合に生じる最も基本的な生物学的疑問は、
@両配列は互いによく似ているか、似ている場合、
Aそれは、これらの進化的な関連によるものか、偶然によるものか
ということです。
これらの疑問に対する答えは、ペアワイズアラインメントで得ることができます。
ペアワイズアラインメントとは、2つの配列に適当なギャップを挿入することによって配列中の同じ位置に同じ塩基やアミノ酸が並ぶようにする操作のことです。
以前から多くのペアワイズアラインメントアルゴリズムが開発されていますが、その中で広く用いられているのが、ダイナミックプログラミング法です。
この方法は、ニードルマン(Needleman)とブンシュ(Wunsch)によって大域的配列に初めて用いられました。
また、スミス(Smith)とウォーターマン(Waterman)によって、局所的配列に用いられました。
大域的配列は、全長にわたって類似していると予想される配列同士の比較に用いられる手法であるのに対し、局所的配列は部分配列を比較して局所的に類似している領域を探し出す場合に用いられる手法です。
整列は2つの配列の端から開始して、配列間のすべての可能な文字列を調べ、一致不一致、ギャップに対してそれぞれスコアをつけながら行列を作成し、行列の最終到達点に達したらトレースバックしてその行列における一連のスコアの最高値の組み合わせを調べます。
関連記事