Copilot Vision(コパイロットビジョン)とは

Copilot Visionとは、Microsoft CopilotPCやブラウザ、スマートフォンの画面やカメラ映像を見せながら質問できる機能です。文章だけで説明しにくい画面操作、資料の見方、アプリの使い方を、見えている内容に沿って相談できます。横に詳しい担当者がいて、同じ画面を見ながら助言してくれる感覚に近いでしょう。

Copilot Visionの仕組み

ユーザーがVisionセッションを開始すると、Copilotは共有された画面やカメラ映像をもとに質問へ答えます。Microsoftのサポートページでは、Windows、Mac、Edge、モバイルアプリから使えることが説明されています。文字で状況を説明する代わりに、画面そのものを文脈として渡す機能です。

画面操作エージェントとの違い

Copilot Visionは、画面を見て助言する機能です。Microsoftは、ユーザーの代わりにクリック、入力、スクロールを行わないと説明しています。つまり、画面を理解して案内するが、実際に操作するのは人間という分担です。自動操作まで任せるAIと混同しない方がよいでしょう。

業務導入での注意

社内ヘルプデスク、Excelや管理画面の操作支援、Webサイト確認、資料レビューなどに向きます。一方で、共有画面には顧客名、売上、契約内容、認証情報が映り込みやすい点に注意が必要です。画面共有型AIは、入力文よりも多くの情報を見せてしまう点を前提に、利用範囲を決める必要があります。

Topic見えるけれど、勝手には操作しない

Microsoftは、Copilot Visionがユーザーの代わりにPCやWebを直接操作しないと説明しています。画面の一部を示したり、次に何をすべきかを説明したりはできますが、クリックや入力の最終操作は人間側に残る設計です。

Copilot Visionに関するよくある質問

Copilot Visionで画面を共有するときの注意点は何ですか?
顧客名、売上、契約内容、認証情報が映り込まないようにすることです。文章入力より多くの情報をAIに見せるため、利用範囲を事前に決める必要があります。
Copilot Visionはどんな業務に向いていますか?
画面を見ながら説明してほしい操作支援、社内ヘルプデスク、資料やWebページの確認に向きます。認証情報や顧客情報が映る画面では利用ルールが必要です。
Copilot Visionと画面共有は何が違いますか?
画面共有は人間に画面を見せる行為です。Copilot VisionではAIが共有画面を文脈として読み取り、質問への回答や操作の案内を行います。

あわせて読みたい記事