Qwen-Imageとは

Qwen-Imageとは、中国アリババのQwen(通義千問)チームが開発する、文章から画像を作り出すAI画像生成モデルです。同じアリババには動画を作るWanがありますが、Qwen-Imageが扱うのは静止画のほうになります。

自社で動かせる、開かれた画像モデル

Qwen-Imageは2025年8月に公開され、モデルの中身(重み)がApache 2.0という条件で無償配布されています。では、何がうれしいのでしょうか。提供元のサービスに頼らず、条件を満たせば自社の環境でも動かせる点です。約200億のパラメータ(モデルの規模を示す数)を持つ大型モデルでありながら、誰でも入手できる開かれた存在。新しく画像を生み出す「生成」だけでなく、できあがった画像の一部を直す「編集」もこなします。商品画像や資料の挿絵を内製したい企業にとって、外にデータを出さずに試せる選択肢になりうるでしょう。土台にあるのは、拡散モデルと呼ばれる画像生成の仕組みです。

Topic画像AIが苦手だった「漢字」に正面から挑む

画像生成AIの長年の泣きどころが、画像の中に入る文字です。とりわけ画数の多い漢字は崩れやすく、看板やポスターを作っても読めない文字になりがちでした。Qwen-Imageは中国語の文字描画を主眼に設計され、アリババによれば中国語と英語の文字が商用に使える水準に達したとされます。「絵は描けても文字は苦手」という常識に、正面から挑んだモデルといえます。

Qwen-Imageに関するよくある質問

Qwen-Imageと、同じアリババのWanは何が違いますか?
Qwen-Imageは文章から静止画を作る画像モデル、Wanは動画を作るモデルです。どちらもアリババ発ですが、画像か動画かで役割が分かれます。
「Qwen」とは何のことですか?
Qwen(クウェン)はアリババの大規模言語モデルや関連モデルのファミリー名で、中国語では通義千問と呼ばれます。Qwen-Imageは、そのファミリーの画像向けモデルにあたります。

あわせて読みたい記事