多くの生物のゲノムが解明されつつあり、情報科学的手法により遺 伝子をコードする領域を予測する必要性が高まっている。コード領 域には、塩基配列のパターンにある種の特徴が見られるので、マル コフモデルを使ってコード領域を予測することができる。予測率を 向上させるためには、より長い塩基配列の出現確率を求める必要が あるが、出現しうる配列パターンの数が指数的に増えるため、大量 の学習データを必要とする。内挿マルコフモデルは、予測に必要な 配列の長さを可変にすることで、少ない学習データでも高い予測確 率を得ることができる。これらの手法について、文献紹介を行う。
Back