「隠れ」「マルコフ」とはどういう意味ですか？

「隠れ」は肝心の状態が直接は見えないこと、「マルコフ」は次の状態が“いまの状態だけ”で決まり、それ以前の履歴を引きずらないという前提を表します。たとえば音声認識では、話し手が次に出そうとする音は外から見えず、聞こえる音声だけが手がかり。HMMはこの見えない状態を観測データから逆算して推定します。

隠れマルコフモデルは今も使われていますか？

音声認識では2009年ごろから深層学習に主役を譲りましたが、それまで長く音声認識を支え、文章の品詞分けやDNAなど生物の配列解析にも応用されてきました。「見えない状態の連なりから観測が生まれる」という考え方は系列データの確率モデルの基礎として今も生き、バイオインフォマティクスなどで使われています。

隠れマルコフモデル(HMM)とは？意味をわかりやすく解説

隠れマルコフモデルとは、直接は見えない「隠れた状態」が時間とともに移り変わり、その状態から観測できるデータが生まれる、と考える確率モデルです。HMMと略されます。音声や文章のように、順番に並んだデータを扱うのが得意で、深層学習が広まる前の音声認識を長年支えた立役者でした。

見えない状態を、出てきたデータから推し量る

たとえば音声認識では、話し手が口の中で次にどの音を出そうとしているかは、外からは見えません。聞こえてくる音声だけが手がかりです。HMMは、この見えない状態の移り変わりを、観測できたデータから逆算して推定します。名前の意味も覚えておくと分かりやすく、「隠れ」は肝心の状態が直接は見えないこと、「マルコフ」は次の状態が“いまの状態だけ”で決まり、それ以前の履歴を引きずらないという前提を表しています。

音声認識を支え、深層学習に主役を譲るまで

HMMの理論は1960年代後半に確立され、1970年代半ばから音声認識に使われ始め、1980年代には主力技術になりました。文章の品詞分け（形態素解析）や、DNAなどの生物の配列の解析にも広く応用されています。これらはいずれもChatGPTが登場する2022年よりはるか前のことで、「声を文字にする」技術はHMMが長く担っていました。

その後、2009年ごろから音声認識に深層学習が取り入れられ、2010年代にかけて主役が移っていきました。とはいえ「見えない状態の連なりから観測が生まれる」という考え方は、系列データを扱う確率モデルの基礎として今も生きており、バイオインフォマティクスなどでは引き続き使われています。

TopicHMMの数学者は、のちに伝説のヘッジファンドへ

HMMを学習させる代表的な方法は「バウム=ウェルチ法」と呼ばれます。この名前に残る数学者レナード・バウムは、その後、数理モデルによる運用で知られるヘッジファンド、ルネサンス・テクノロジーズの前身となった会社で、為替取引のモデルづくりに携わりました（1984年に退社）。確率モデルの理論が、音声認識だけでなく金融の世界にもつながっていたという、知っておくと面白い意外な縁です。

隠れマルコフモデルに関するよくある質問

「隠れ」「マルコフ」とはどういう意味ですか？: 「隠れ」は肝心の状態が直接は見えないこと、「マルコフ」は次の状態が“いまの状態だけ”で決まり、それ以前の履歴を引きずらないという前提を表します。たとえば音声認識では、話し手が次に出そうとする音は外から見えず、聞こえる音声だけが手がかり。HMMはこの見えない状態を観測データから逆算して推定します。
隠れマルコフモデルは今も使われていますか？: 音声認識では2009年ごろから深層学習に主役を譲りましたが、それまで長く音声認識を支え、文章の品詞分けやDNAなど生物の配列解析にも応用されてきました。「見えない状態の連なりから観測が生まれる」という考え方は系列データの確率モデルの基礎として今も生き、バイオインフォマティクスなどで使われています。
隠れマルコフモデルにまつわる面白い逸話はありますか？: 学習の代表的な方法「バウム=ウェルチ法」に名を残す数学者レナード・バウムは、その後、数理モデル運用で知られるヘッジファンド、ルネサンス・テクノロジーズの前身となった会社で為替取引のモデルづくりに携わりました（1984年退社）。確率モデルの理論が金融の世界にもつながっていた、意外な縁です。

隠れマルコフモデルとは

見えない状態を、出てきたデータから推し量る

音声認識を支え、深層学習に主役を譲るまで

TopicHMMの数学者は、のちに伝説のヘッジファンドへ

隠れマルコフモデルに関するよくある質問

あわせて読みたい記事

AIツールの利用許可ルールは全社員一律でよいのか部署別に分ける3つの基準

果たしてChatGPTの利用料は下がるのか？OpenAI独自AIチップで変わる企業向けAI費用

Google Apps ScriptがWorkspaceコアサービス化　社内自動化の内製はどこまで進められるか

いま読まれている用語

まだそこまで読まれていない用語

見えない状態を、出てきたデータから推し量る

音声認識を支え、深層学習に主役を譲るまで

TopicHMMの数学者は、のちに伝説のヘッジファンドへ

隠れマルコフモデルに関するよくある質問

AIツールの利用許可ルールは全社員一律でよいのか 部署別に分ける3つの基準

果たしてChatGPTの利用料は下がるのか？OpenAI独自AIチップで変わる企業向けAI費用

Google Apps ScriptがWorkspaceコアサービス化 社内自動化の内製はどこまで進められるか

いま読まれている用語

まだそこまで読まれていない用語

AIツールの利用許可ルールは全社員一律でよいのか部署別に分ける3つの基準

Google Apps ScriptがWorkspaceコアサービス化　社内自動化の内製はどこまで進められるか