iPad Workers
iPad Workers
#157:画像生成が変わった!ChatGPT-4oのすごすぎる進化
0:00
-19:55

#157:画像生成が変わった!ChatGPT-4oのすごすぎる進化

日本語もOK、スタイル変更も自由自在に

👋 こんにちは、はるなです。

今日のテーマは「ChatGPTの画像生成の大きな変化について」です。

おすすめの記事

🎧 iPad Workers Podcastは毎週、木曜日配信予定のポッドキャスト番組です。
リクエスト・感想などは #iPadWorkersのハッシュタグを付けて投稿してください。

🖼️ ChatGPTの画像生成は何が変わったのか?

ChatGPTの画像生成エンジンが、これまでと大きく変わりました。これまでは「DALL·E 3」という外部エンジンを使っていましたが、3月25日頃からOpenAI自社製の「ChatGPT-4o Image Generation」に切り替わりました。

従来の「DALL·E 3」と比べて、以下のような点で大きく進化しています。

ChatGPT-4o Image Generationの特徴

  • テキストを含む画像生成:看板やロゴなど、文字が入った画像も作成OK

  • キャラクターの固定:同じキャラクターのバリエーションが出せる

  • 画像スタイルの変換:「〇〇風」と伝えるだけで簡単にスタイル変更できる

  • 透過画像の生成:透明風ではなく透過PNGが生成できる

一部テキストがおかしいところはありますが、4つの特徴を画像化してほしいと頼んだだけで、上記画像が生成できます。

これまでの仕組みでは、ChatGPTがDALL·E 3用のプロンプトに翻訳して指示を出していましたが、新しい仕組みではChatGPTがネイティブに画像生成できるようになりました。

より簡単にイメージをビジュアル化することができます。

無料プランの人にも開放されている機能ですが、話題になってみんなが使いまくるから、OpenAI側のGPU負荷が激しくなりすぎて、無料プランの人は1日に3枚までという制限がかかっています。有料プランの人は短時間に連続して生成すると、「時間をあけてね」というメッセージが出ますが、生成枚数に制限はありません。

新しい画像生成モデルは、最初にボヤけた全体像が表示され、上から順番に画像が表示されていきます。

🈶 日本語もだいたい表現できるように

最も大きな変化は文字の生成、特に日本語が描画できるようになった点です。

これまでのDALL·E 3を使った画像生成では、テキストの描画が全くダメでした。特に日本語は意味不明な文字のようなものしか生成できません。アルファベットですらスペルミスが多く、あまり信用できませんでした。

新バージョンでは、ほぼ正確な日本語を生成できるようになりました。一部の漢字が崩れていますが、ほぼ実用レベルに達しています。

セミナー概要を送っただけで、この画像が作られてしまうのです。すごくないですか?

上記画像から少し調整をかけて完成したものがこちらです。画像編集ソフトは一切使わず、ChatGPTの画像生成のみで出したものです。(👉Obsidianセミナー詳細はこちら

セミナー概要を送っただけではあるんですが、送る時のフォーマットにコツがあるので、その雛形は土日のプロセス紹介ニュースレターで送ります。興味のある方はぜひプロプランへ。お試し期間もついてます。

雛形なしの状態でセミナー概要を送ると、こんな感じの画像しか生成できません。決して悪くはないけど、ちょっと足りない感じがします。

⚖️ 著作権の問題も

ChatGPTの画像生成アップデート、全般的にかなりいい感じなんですが、問題点もあります。著作権に関わる問題です。「ジブリ風」といった指示をすると、まるで本物のジブリ作品のようなイラストが生成されてしまいます。

特定のブランドロゴなども、これは完全にアウトなのでは?というレベルで描画されてしまう場合があります。一応、テキスト上は「できません」と言っていますが、生成された画像にはほぼそれとわかる形で描画されています。

こうしたグレーゾーンについては、生成AI業界全体で長く議論されていますが、まだ明確なルールが確立されていないのが現状です。特に「〇〇風」という曖昧な指示が許容される場合、それがどこまで許されるのかという線引きがとても難しくなります。

たとえば「ピカソ風」「葛飾北斎風」といった、すでに著作権が消滅したアーティストのスタイルを模倣することは、基本的に問題視されません。ですが、「ジブリ風」「ディズニー風」「ピクサー風」といった現役で権利が生きているスタジオのスタイルを真似た場合、それが “創作的なオマージュ”とされるのか、“著作権侵害の疑いがある模倣”と見なされるのかは非常にグレー です。

AIにとってスタイルは、膨大なデータの中から抽出した「傾向の集合体」に過ぎません。しかし、人間の目から見ると、明らかに「あのキャラみたい」「あのアニメっぽい」と感じてしまうのも事実です。

AIが生成した画像を利用する場合、思わぬところでトラブルになる可能性があるため注意は必要です。クリエイターとして活動している身としては、この辺りの法整備や明確なガイドラインが必要だと感じています。ただ、個人で楽しむ分にはとても魅力的なものであることは間違いありません。

ChatGPTの新しい画像生成機能は、iPhoneやiPadのChatGPTアプリでも使用可能です。ChatGPT-4oモデルを選択した状態で「画像を作って」と言うと、新しい画像生成モデルで画像生成ができます。

ということで今日は「ChatGPTの画像生成モデルが新しくなってすごい使えるようになった」というお話でした。

👇4月7日発売『📘iPadアプリ図鑑2025』予約受付中。2024年版からめちゃくちゃボリュームアップしてます!

Discussion about this episode