多くの生物のゲノムが解明されつつあり、情報科学的手法により遺
伝子をコードする領域を予測する必要性が高まっている。コード領
域には、塩基配列のパターンにある種の特徴が見られるので、マル
コフモデルを使ってコード領域を予測することができる。予測率を
向上させるためには、より長い塩基配列の出現確率を求める必要が
あるが、出現しうる配列パターンの数が指数的に増えるため、大量
の学習データを必要とする。内挿マルコフモデルは、予測に必要な
配列の長さを可変にすることで、少ない学習データでも高い予測確
率を得ることができる。これらの手法について、文献紹介を行う。
Back