隠れマルコフモデルとは
隠れマルコフモデルとは、直接は見えない「隠れた状態」が時間とともに移り変わり、その状態から観測できるデータが生まれる、と考える確率モデルです。HMMと略されます。音声や文章のように、順番に並んだデータを扱うのが得意で、深層学習が広まる前の音声認識を長年支えた立役者でした。
見えない状態を、出てきたデータから推し量る
たとえば音声認識では、話し手が口の中で次にどの音を出そうとしているかは、外からは見えません。聞こえてくる音声だけが手がかりです。HMMは、この見えない状態の移り変わりを、観測できたデータから逆算して推定します。名前の意味も覚えておくと分かりやすく、「隠れ」は肝心の状態が直接は見えないこと、「マルコフ」は次の状態が“いまの状態だけ”で決まり、それ以前の履歴を引きずらないという前提を表しています。
音声認識を支え、深層学習に主役を譲るまで
HMMの理論は1960年代後半に確立され、1970年代半ばから音声認識に使われ始め、1980年代には主力技術になりました。文章の品詞分け(形態素解析)や、DNAなどの生物の配列の解析にも広く応用されています。これらはいずれもChatGPTが登場する2022年よりはるか前のことで、「声を文字にする」技術はHMMが長く担っていました。
その後、2009年ごろから音声認識に深層学習が取り入れられ、2010年代にかけて主役が移っていきました。とはいえ「見えない状態の連なりから観測が生まれる」という考え方は、系列データを扱う確率モデルの基礎として今も生きており、バイオインフォマティクスなどでは引き続き使われています。
TopicHMMの数学者は、のちに伝説のヘッジファンドへ
HMMを学習させる代表的な方法は「バウム=ウェルチ法」と呼ばれます。この名前に残る数学者レナード・バウムは、その後、数理モデルによる運用で知られるヘッジファンド、ルネサンス・テクノロジーズの前身となった会社で、為替取引のモデルづくりに携わりました(1984年に退社)。確率モデルの理論が、音声認識だけでなく金融の世界にもつながっていたという、知っておくと面白い意外な縁です。
隠れマルコフモデルに関するよくある質問
- 「隠れ」「マルコフ」とはどういう意味ですか?
- 「隠れ」は肝心の状態が直接は見えないこと、「マルコフ」は次の状態が“いまの状態だけ”で決まり、それ以前の履歴を引きずらないという前提を表します。たとえば音声認識では、話し手が次に出そうとする音は外から見えず、聞こえる音声だけが手がかり。HMMはこの見えない状態を観測データから逆算して推定します。
- 隠れマルコフモデルは今も使われていますか?
- 音声認識では2009年ごろから深層学習に主役を譲りましたが、それまで長く音声認識を支え、文章の品詞分けやDNAなど生物の配列解析にも応用されてきました。「見えない状態の連なりから観測が生まれる」という考え方は系列データの確率モデルの基礎として今も生き、バイオインフォマティクスなどで使われています。
- 隠れマルコフモデルにまつわる面白い逸話はありますか?
- 学習の代表的な方法「バウム=ウェルチ法」に名を残す数学者レナード・バウムは、その後、数理モデル運用で知られるヘッジファンド、ルネサンス・テクノロジーズの前身となった会社で為替取引のモデルづくりに携わりました(1984年退社)。確率モデルの理論が金融の世界にもつながっていた、意外な縁です。