ボイスクローンとは
ボイスクローンとは、特定の人の声をAIで再現し、その人が実際には話していないセリフまで本人の声で作り出す技術です。声を対象にした「音声版のディープフェイク」とも呼ばれます。
わずか数十秒の録音で声を再現
仕組みは、本人の録音をAIが学習し、その声の特徴をつかんで別の文章を読ませるというものです。音声合成の一種ですが、「誰の声でもいい」ではなく「この人の声で」という点が大きな違いになります。かつては何十時間もの録音が必要でした。ところが技術は急速に進み、2024年には、わずか15秒ほどの音声で声を再現できる水準にまで到達しています。手軽になった分だけ、悪用の入り口も広がったといえるでしょう。
便利さと、なりすましの危うさ
使い道は前向きなものも多くあります。一度声を登録すればナレーションを録り直さずに済み、経営者メッセージを多言語へ広げることもできます。半面、危うさも見過ごせません。本人になりすました音声で、振り込め詐欺や電話の本人確認の突破に悪用される事例が報告されています。実際に、合成音声で銀行の声による認証をすり抜けた実演も行われました。社内では、声による本人確認だけに頼らない備えが要るでしょう。
Topic失った「自分の声」を取り戻す使い方
ボイスクローンには、心を打つ使い道もあります。病気などで声を失った人が、発症前の録音から自分の声を再建し、ふたたび「自分の声」で話せるようにする取り組みです。同じ技術が、詐欺の道具にも、誰かの尊厳を支える助けにもなります。何に使うかが問われる技術だといえるのではないでしょうか。
関連用語
ボイスクローンに関するよくある質問
- ボイスクローンと音声合成は何が違いますか?
- 音声合成は文章を話し声に変える技術全般を指します。ボイスクローンはそのうち、特定の人の声をまねて再現する使い方に絞った、より狭い言葉です。
- 自分の声を勝手にコピーされる心配はありませんか?
- リスクはあります。短い録音から声を再現でき、なりすまし詐欺への悪用も報告されています。多くのサービスは本人の同意を求めており、誰の声かの確認が前提になります。
- 有名人や知人の声を作って公開してもよいですか?
- 本人の許可がなければ避けるべきです。無断での声の再現は権利の侵害やなりすましにあたる恐れがあり、サービスの規約でも禁じられているのが一般的です。