Gemini 3.5 Live Translateとは

Gemini 3.5 Live Translateとは、Googleが2026年6月9日に発表した、話している声をそのまま別の言語の音声へ、ほぼ同時に訳すAIモデルです。70以上の言語に対応し、話者の抑揚や話す速さ、声の高さを保ったまま訳すのが特徴で、外国語の通話やオンライン会議で、まるで通訳が間に入ったように使えます。名前に「Gemini 3.5」と付きますが、これはチャットAIGeminiが新しい世代に上がったという話ではなく、音声翻訳に特化した専用モデルの呼び名と捉えてください。

話し終わるのを待たずに訳し始める

従来の翻訳ツールの多くは、こちらが一文を話し終えてから訳を返す仕組みでした。これだと会話のたびに沈黙が生まれ、テンポが悪くなりがちです。Gemini 3.5 Live Translateは、話している最中から訳し始め、話者の数秒うしろを追いかけ続けます。いわば、一文ずつ訳す「逐次通訳」ではなく、話に重ねて訳す「同時通訳」に近い動き方でしょう。不自然な間が空かないため、会話の自然な流れを保ったまま言葉の壁を越えられる。ここがこの技術の核です。声の調子まで残すので、機械が棒読みするのとは違う温度感も伝わります。

どこで使えるのか

提供先は用途ごとに分かれています。開発者向けにはGemini Live APIとGoogle AI Studioから公開プレビューで提供。企業向けはGoogle Meetで2026年6月から限定プレビューが始まります。一般の利用者は、Google Translate(翻訳)アプリのAndroid版・iOS版で順次使えるようになるでしょう。とくにGoogle Meetでは、これまで5言語だった対応が70言語超へ広がり、会議の中で2千通りを超える言語の組み合わせが成り立つといいます。海外拠点や多国籍のメンバーと話すとき、言語ごとに通訳を手配する負担を減らせるかもしれません。Androidには、受話口から訳した声を直接聞ける「リスニングモード」も加わりました。

Topic訳した声に、聞こえない「印」が埋め込まれている

このモデルが出力する音声には、すべてSynthIDというGoogleの電子透かしが入っています。面白いのは、その印を音声ファイルの付帯情報として外付けするのではなく、人間の耳には聞こえない形で音声そのものに織り込んでいる点です。切り出して別の場所に貼り付けられても印が残りやすく、「この声はAIが作ったものか」を後から見分ける手がかりになります。本物そっくりの合成音声が増えるなかで、なりすましやフェイク音声への備えとして仕込まれた仕組みといえます。

Gemini 3.5 Live Translateに関するよくある質問

訳された音声は、機械的な棒読みになりませんか?
元の話者の抑揚・話す速さ・声の高さを保ったまま訳すよう設計されています。そのため、感情の乗らない平坦な読み上げになりにくく、話し手の調子がある程度伝わるのが特徴です。
これがあれば通訳者や既存の翻訳アプリは不要になりますか?
会話のテンポを保てる強力な道具ですが、訳は話者の数秒うしろを追う「ほぼ同時」で、誤訳の可能性もゼロではありません。重要な交渉や契約の場では、人の通訳や確認を併用するのが現実的です。

あわせて読みたい記事