Operatorとは

Operatorとは、OpenAIが2025年1月に公開した、ChatGPTが自分でブラウザを操作して人の代わりにWeb上の作業を進めるAIエージェントです。OpenAIは2025年1月23日にOperatorを発表し、画面のボタンを押す、文字を入力する、スクロールするといった操作で、フォーム入力や買い物のような繰り返し作業を任せられると説明しました。質問に答えるだけでなく、実際に画面を操作するChatGPTです。

どんな仕組みで動くのか

Operatorは、CUA(Computer-Using Agent)と呼ばれるモデルで動きます。これはGPT-4oの画像認識と、試行錯誤から学ぶ強化学習を組み合わせ、人と同じように画面を見て操作するために作られた仕組みです。専門知識がなくても、やってほしい作業を言葉で頼めば、Operatorがサイトを移動しながら進めてくれます。

最初は限られた人向けの試験提供からのスタート。2025年2月1日に、まず米国のChatGPT Pro利用者へ研究プレビューとして開放されたのが出発点です。いきなり全員が使える機能ではなく、少しずつ広げる進め方でした。

いまの立ち位置とビジネスでの使われ方

単独の機能としてのOperatorは、2025年7月17日にChatGPTの中へ統合され、ChatGPTエージェントという名前へ引き継がれました。いまのChatGPTが持つ「Webを操作する力」の出発点が、このOperator。調査の下準備、競合の情報集め、申込フォームの記入のような定型作業を任せる用途で語られてきました。では経営の現場では何に効くのか。人手でやっていた単純な画面作業を肩代わりさせ、人は判断に時間を回す、という使い方が想像しやすいでしょう。

ただし、すべてを丸ごと任せる前提ではありません。OpenAIは、影響の大きい操作の前には利用者に確認を求め、いつでも中断や引き継ぎができるようにしていました。AIに見せた情報やログインは、AIが操作できる範囲にもなるため、扱うデータの範囲を決めてから任せるのが安全です。

Topic動かすのは「あなたのパソコン」ではない

Operatorが操作するのは、手元のパソコンではなく、クラウド上に用意された専用のブラウザでした。自分のPCの画面が勝手に動くのではなく、離れた場所でAIが代わりに画面を見て操作している、と捉えると分かりやすいでしょうか。手元の環境を直接いじられない分、どこまで任せるかを自分でコントロールしやすい形になっていました。

Operatorに関するよくある質問

今もOperatorを単体で使えますか?
単独での提供は終了し、機能はChatGPTエージェントへ移りました(2025年7月)。これから使う場合はChatGPTエージェント側になります。
Operatorはすぐに誰でも使えましたか?
いいえ。公開直後は限定的で、最初は一部の有料利用者だけが試せる段階から始まりました。
買い物や予約を任せても安全ですか?
影響の大きい操作の前には確認を挟む設計でした。ログイン情報や決済を扱うときは、任せる範囲を絞ると安全です。

Operatorに関連する記事