OpenAIから、待望の新型画像生成モデル「GPT-Image-1.5」が登場しました。

今回の目玉は、なんといってもキャラクターの「一貫性」と、会話感覚で直せる「編集機能」の進化、そして「テキスト(日本)の正確な描写」です。

本記事では、筆者が実際にこのツールを使い倒して分かったリアルな使用感から、強力なライバルである「Nano-Banana Pro(ナノバナナ プロ)」との徹底比較まで、余すことなくレビューします。

WordPressテーマ「PANDORA」
WordPressテーマ「PANDORA」
レイアウト自由自在なブログ・メディアを構築。

「GPT-Image-1.5」とは?

GPT-Image-1.5で作成

「GPT-Image-1.5」は、OpenAIが開発した新しいフラッグシップ画像生成AIモデルです。

画像の新規生成はもちろん、既存画像の編集も思いのまま。生成スピードは最大4倍に高速化されています。

専用アプリは不要で、いつものChatGPTのチャット画面(ブラウザ・アプリ)からそのまま画像を生成できます。

「GPT-Image-1.5」の特徴

「GPT-Image-1.5」は、従来の画像生成AIの「弱点」をかなり克服しています。特に注目すべき3つの特徴を解説します。

  1. キャラクターの「一貫性」
  2. クリエイティブなアレンジ
  3. 文字の描写が大幅に改善

キャラクターの「一貫性」

GPT-Image-1.5の最大の特徴は、キャラクターや人物の「一貫性」を保てる点にあります。

これまでの画像生成AIでは、特定の人物の顔や雰囲気を維持したまま、背景や服装だけを編集するのは至難の業でした。しかし、今回のモデルはGoogleの「Nano Banana」と同様、この弱点をほぼ完璧に克服しています。

たとえば、冒頭で登場した女性が「レストランでパスタを食べているシーン」を生成したのがこちら。

ご覧のとおり、顔やメガネ、髪型などが完璧に維持されています。さらに、この女性の服装だけを「赤色のニット」に変えてみるとどうでしょう。

顔はもちろん、背景や料理などもそのままに、服装だけが綺麗に切り替わっていますね。

クリエイティブなアレンジ

先ほどの「一貫性」を活かせば、クリエイティブなアレンジも自由自在です。

例として、さきほどの女性を再登場させ、今度は「80年代のエアロビクス風」にしてみましょう。

頬についたミートソースまで維持したまま、まるで80年代のフィットネス番組を録画したようなワンシーンが生成されました。

さらに、同じ女性をキャラクター化して「LINEスタンプ風」に。

このように同一人物でありながら、実写からイラストまで世界観を飛び越えたクリエイティブが、プロンプト一つで完結します。

文字の描写が大幅に改善

「文字(特に日本語)」の描写は、長らく画像生成AIの課題でした。これまではテキストを指定しても、意味不明な記号に変換されてしまうケースが大半だったからです。

しかし今回、その精度はここまで向上しました。

よく見ると「進」の字に若干の惜しさは残るものの、それ以外の文字は崩れることなく描写されています。

まだ100%完璧とは言えないまでも、指示した日本語をかなり正確に出力できるようになりました。

「GPT-Image-1.5」の使い方

使い方はシンプル。基本的には、これまでのChatGPTと同じく「チャットで話しかけるだけ」で完結します。

1. いつものチャットで生成・編集する

特別な設定は必要ありません。いつものチャット画面に「〇〇の画像を作って」と入力すれば、すぐに画像が生成されます。

もし修正したい場合は、続けて「服を赤にして」「背景を海に変えて」とチャットで指示を出してください。新しいエディタなどを開くことなく、会話の流れの中で自然に画像が修正されていきます。

2. 「画像ページ」で履歴やアイデアを探す

今回、サイドバーに新しく「画像」ページが追加されました。

ここをクリックすると、以下の機能が利用できます。

  • スタイルの選択:「水墨画」「ポップポスター」などの画風を試す
  • アイデア探し:生成のヒントを見つける
  • 履歴の確認:過去に作った画像がズラッと表示される

ここから入力しても、最終的には「いつものチャット画面」に切り替わって生成されます。「どんな画像を作ろうかな?」と迷ったときや、過去の作品を見返したいときに便利です。

ライバル「Nano-Banana Pro」との性能比較

続いて、現在の画像生成AI界隈でトップクラスの実力を持つ、Googleの「Nano-Banana Pro(ナノバナナ プロ)」と比較してみます。

ナノバナナ プロといえば、「キャラクターの一貫性」や「テキスト描写」に定評があるモデルです。今回は以下の3点で勝負させてみました。

  1. 複雑なプロンプトへの対応
  2. テキストの描写力
  3. 広告デザイン

先に結論を言ってしまうと、個人的にはまだ「Nano-Banana Pro」に軍配が上がるという印象です。その理由を、実際の生成結果とともに解説します。

比較1:複雑なプロンプトへの対応力

まずは「ガラス越しの描写」を含んだ、複雑な指示への対応力です。

プロンプト: 「ガラス越しに撮影した実写風の人物写真。反射の光と背景のボケが自然で、肌や質感が非常にリアルなハイクオリティポートレート。サイズは16:9の横長」

人物のリアルさはもちろん、ガラスの反射という複雑な要素をどう処理するかがポイントです。結果はこちら。

個人的には、「Nano-Banana Pro」の圧勝だと感じました

GPT-Image-1.5も美しくはありますが、どうしても肌や髪に特有の「AIっぽさ」が残り、指示にあった「ガラスの反射」もほぼ無視されてしまっています。

一方でナノバナナは、肌の質感などが非常にリアル。ガラスに映り込んだ街の光や雨粒の表現まで、かなり自然に再現されています。

今回の結果に限らず、両者をガッツリ使い込んだ感想としても、「人物のリアルさ」や「複雑なプロンプトへの対応力」に関しては、現時点ではナノバナナの方が優れているという印象です。

比較2:日本語テキストの描写精度

2つ目の検証項目は、「文字(日本語)の正確さ」です。

ここでは、以下のニュース原稿を指示し、正確に描画できるかテストしました。

指定テキスト: 【速報】次世代AIロボット「S-2026」がついに発売開始。家事代行から介護まで、あなたの生活を完全サポート。月額9,800円から。

まずは「渋谷の電光掲示板に映し出す」という、背景が複雑なシチュエーションで試します。

差は歴然です。

「Nano-Banana Pro」は、漢字・カタカナ・数字が混在する長文を一言一句、完璧に出力しました(少し字が小さくて見づらいですが、1文字も崩れていません)。加えて、渋谷の街の再現もリアル。

対して「GPT-Image-1.5」は、文字崩れが目立ちます。

条件を変えて再テスト

では、GPTは日本語が苦手なのでしょうか?

今度は背景の要素を極力減らし、「机の上のノートに同じ文章を書く」というシンプルな指示で試してみました。

すると今度は、両者ともに完璧に描写できました。

この結果から、GPT-Image-1.5は「背景描写(渋谷の街並みなど)にリソースを割かれると、文字の維持がおろそかになる」という傾向が見て取れます。

どんな状況でも文字を崩さない「安定感」に関しては、やはりNano-Banana Proが優勢です。

比較3:広告クリエイティブのセンス

最後は「広告デザイン」のセンスです。ここではあえて細かい指定はせず、AI自身のセンスを問うために、極めてシンプルなプロンプトを投げかけてみました。

プロンプト: 「新型PCの洗練された広告を作って」

これに関しては、どちらも甲乙つけがたい高レベルな出来栄えです。

GPT-Image-1.5は「近未来的なテック感」を、Nano-Banana Proは「静寂でミニマルな空気感」を見事に表現しています。

細かく指示をすれば差が出るかもしれませんが、今回のような「ふわっとした指示」でのアイデア出しにおいては、両モデルとも高レベルな実力を持っていると言えるでしょう。

「GPT-Image-1.5」の料金プラン

「GPT-Image-1.5」は、基本的に無料で利用可能です。

ただし、無料プランには「1日〇枚まで」といった生成回数の制限があると思われます(具体的な枚数は公表されていません)。

参考までに、有料プラン(Plus)を利用している筆者が、当記事を書くにあたって1日で150枚ほど生成しましたが、制限に達することはありませんでした。

お試しで触る分には無料プランで十分ですが、納得いくまで何度も生成・修正を繰り返したい方は、有料プランの方がストレスなく楽しめるでしょう。

「GPT-Image-1.5」の注意点

最後に、「GPT-Image-1.5」を利用するうえで事前に押さえておきたいポイントを紹介します。

商用利用と著作権について

OpenAIの規約上、生成した画像の所有権はユーザーにあり、商用利用も可能です。

ただし、「AIで作った画像に著作権が発生するか?」については、法的な議論が続いているグレーゾーンでもあります。

ビジネスで利用する場合、特に他者への提供物として扱う際は、トラブル防止のために慎重な運用を心がけましょう。

生成できない画像(コンテンツポリシー)

何でも自由に作れるわけではありません。OpenAIのポリシーにより、以下の要素を含むプロンプトはブロックされます。

  • 成人向け(アダルト)コンテンツ
  • 暴力的・グロテスクな表現
  • 実在する人物(有名人・政治家など)
  • 他社の商標や著作権侵害の恐れがあるもの

特に、実在する人物や既存のキャラクター、ブランドロゴなどに似せた画像は、権利侵害となるリスクがあるため注意してください。

まとめ

今回は、OpenAIの最新モデル「GPT-Image-1.5」の特徴や使い方、そしてライバル「Nano-Banana Pro」との比較検証をお届けしました。

検証の結果、純粋な描画力や日本語の安定感では「Nano-Banana Pro」に一日の長があるものの、GPT-Image-1.5も前モデルより劇的な進化を遂げています。

まだ完璧ではない部分もありますが、ブログの挿絵やアイデア出しなどにおいて、強力なパートナーになることは間違いありません。まずは無料プランで、その進化を体感してみてはいかがでしょうか。

WordPressテーマ「PANDORA」
WordPressテーマ「PANDORA」
レイアウト自由自在なブログ・メディアを構築。