2024年も残り3か月近くとなりましたが、いかがお過ごしでしょうか。
今年もさまざまな生成AIサービスが、雨後のタケノコのごとく次々にリリースされていますね。
そんな中、Googleの画像生成AIツール「ImageFX」が話題になっています。
ImageFXは、Googleがリリースしている、テキストから画像が生成できるAIツールです。
特に実写系のリアルな画像生成に強く、プロンプトに対しての理解度がとても高い画像を、一瞬で生成してくれます。
Googleアカウントがあれば、誰でも無料で生成可能です。
無料で使用できる画像生成AIは、DALL·E 3(ChatGPT経由)や、Leonardo AIなどがあります。
そんな中、今回ご紹介するImageFXは、結論、「日本人や日本文化に対しての解像度が高い!」、「世界各国に対してのそれぞれの理解度が半端ない!」という印象でした。
今回は、このImageFXの特徴を解説しながら、実際に生成した画像も共有していきますね。
使い方についてもわかりやすく画像付きで説明しますので、ご安心を。
では、いきましょう!
ImageFXとは
ImageFXは、Googleが提供している画像生成AIツール。
2024年8月に、最新のAI画像生成モデル「Imagen 3」を搭載したImageFXが、日本でも一般利用が可能になったことで、大きな話題となっています。
ImageFXには、独自のExpressive Chips(表現力チップ)が搭載されていることで、シンプルなプロンプトでも、イメージに近い画像が生成可能です。
2024年9月3日現在、Googleアカウントをもっているユーザーであれば、誰でも無料で生成できます。
ImageFX 3つの特徴
ImageFXの特徴は、大きく3つ。
- Googleアカウントで簡単に利用可能
- リアルで高品質な画像生成
- 日本文化に対しての理解力の高さ
Googleアカウントで簡単に利用可能
ImageFXは、Googleアカウントさえあれば、誰でも無料で使えます。
面倒な登録手続きや専門知識は一切不要。
使い方も直感的で、思い描いた画像を、シンプルなプロンプトで瞬時に生成できるのが特徴です。
リアルで高品質な画像生成
ImageFXは、ハイクオリティーな画像生成を得意としています。
2024年8月に最新モデル「Imagen3」がリリースされ、「Imagen3」がImageFXに搭載されたことにより、大幅に画質が向上しました。
「Imagen3」は、高精細な画像生成能力をもっており、とても無料とは思えない品質の画像を、一瞬で生成できます。
上記は、「A craftsman’s hand sewing indigo-dyed stitches.(藍染めの生地を刺し子する職人の手。)」というプロンプトに対して、ImageFXが一発で生成した画像です。
糸のニュアンス、素材感がとても細かく表現されており、高精細な画像だという事がおわかり頂けると思います。
このようにImageFXは、「Imagen3」が搭載された事により、高品質な画像を生成することが容易となりました。
日本文化に対しての理解力の高さ
ImageFXは、日本文化への深い理解と表現力が特徴的です。
これは、MidjourneyやChatGPT(Dalle 3)と比較しても、1つ頭が抜きに出ているほどの理解力だと感じます。
正確にいうと、各国の文化に対しての理解度が高いイメージです。
試しに、「Japanese Idol Group(日本のアイドルグループ)」というシンプルなプロンプトで生成してみましょう。
ImageFXとMidjourneyで比較してみます。
ImageFX
Midjourney
ImageFXの方が、「日本のアイドルグループ」に対しての理解度が高いのがお分かり頂けると思います。
他国の文化に対しての理解度をはかるために、「Korean Idol Group(韓国のアイドルグループ)」というプロンプトでも比べてみます。
ImageFX
Midjourney
これに関しては、Midjourneyも、K-POPアイドルに対しての理解度の高さが伺えますが、やはりImageFXの解像度の高さはあっぱれです。
ImageFXの料金は?
ImageFXは、無料で利用可能です。
有料プランは用意されておらず、無料プランのみを提供しています。
Googleアカウントを持っていれば、アカウント連携するだけで、すぐに生成可能です。
ImageFXは商用利用OK?
ImageFXの商用利用の可否については、現状、ポリシーに具体的な明記がありません。(2024年9月8日現在)
生成AIによってつくられた画像に関しては、意図せずに著作権侵害になってしまう可能性があります。
ポリシーに具体的な明記がない以上、商用利用は避けたほうがいいでしょう。
ImageFXの基本的な使い方
では、ImageFXの使い方を解説していきます。
使い方は非常に簡単。
Googleアカウントをもっていれば、無料ですぐに使えます。
ImageFXの公式HPにアクセスし、右上の「Googleでログイン」をクリックします。
連携するGoogleアカウントを選択しましょう。
プライバシーポリシーと利用規約に同意したら、ImageFXのトップ画面に遷移します。
では、プロンプト入力欄(上記画像の赤枠箇所)に英語でプロンプトを入力してみます。
(2024年9月16日時点では、日本語プロンプトでの生成精度が低かったため、英語プロンプトを推奨します。)
Autumn in Japan. Beautiful Mt. Fuji can be seen behind the lake.(日本の秋。湖の奥に美しい富士山が見える。)
ImageFXのプロンプト入力欄に、上記のプロンプトを入力し、「作成」ボタンを押すだけ。
簡単ですね。
10秒ほど待つと…
プロンプトに対して、理解度のかなり高い画像が生成されました!
秋を想起させる紅葉や、富士山にかかる雪の量など、とても再現度が高いですね。
生成した画像を編集する
生成した画像にマウスオーバーすると、画像の左下に「画像を編集する」ボタンが表示されるので、クリックして編集してみましょう。
編集画面では、修正したい箇所をブラシで選択し、その箇所をどのように修正したいかをプロンプトで入力します。
試しに、湖上に白鳥を2羽追加してみましょう。
追加プロンプトは、「Two swans are flying gracefully over the lake.(湖の上を、白鳥が2羽、優雅に飛んでいる。)」でいきます。
おおーーー!白鳥が2羽飛びました!
修正作業も、非常に直観的にできるので、画像生成に慣れていない人でも簡単にできます。
ぜひ、チャレンジしてみてください。
ImageFXの画像生成事例をいくつかご紹介
では、ここからは、僕がImageFXで生成した画像をご紹介していきます。
まずは、以下のプロンプトをImageFXに投げてみましょう。
A runway show of world-renowned Japanese collection brands presenting their Fall-Winter 2025 collections inside a traditional Parisian building. The collection features traditional Japanese fabrics and avant-garde big silhouettes.
(世界的に有名な日本のコレクションブランドが、パリの伝統的な建物の中で2025年秋冬コレクションを発表するランウェイショー。日本の伝統的な素材とアバンギャルドなビッグシルエットが特徴。)
10秒ほど待つと…
おおぉーーー!
羽織りを想起させるタイロッケンコートのようなアウターに、言語化は難しいですが前衛的なメイクがほどこされた画像が生成されてきました。
こちらも同プロンプトで生成されて1枚。
1つ1つのアイテムは、けっして前衛的ではないですが、「●●のブランドっぽい」と形容できないオリジナリティーを感じるコレクションです。
プロンプトの理解度はとても高いですね。
では次に、ボクシングの試合の臨場感のある画像を生成してみましょう。
ChatGPTに以下のプロンプトを考えてもらい、そのままImageFXに指示出ししてみます。
A dynamic and intense boxing match inside a professional boxing ring. The focus is on two athletes: one on the left is a muscular, shirtless Japanese male boxer wearing black trunks with ‘ABC’ and ‘JPN’ logos, delivering a powerful straight punch with his right hand. The boxer on the right, a darker-skinned fighter, is wearing black trunks with logos, gloves, and is blocking the punch with his guard up, protecting his head. The atmosphere is electrifying with bright arena lights and a dark background. A referee and a digital screen are visible in the background, showing the intensity of the match.
(プロボクシングのリングでのダイナミックで激しい試合。左の選手は、「ABC」と「JPN」のロゴが入った黒いトランクスを履き、右手で強烈なストレートのパンチを繰り出す、筋肉質でシャツを脱いだ日本人男性ボクサー。右側の肌の黒いボクサーは、ロゴ入りの黒いトランクスにグローブをはめ、ガードを上げて頭を守りながらパンチをブロックしている。明るいアリーナの照明と暗い背景。背景にはレフェリーとデジタルスクリーンが見え、試合の激しさを物語っている。)
かなり細かいプロンプトを生成すると、ここまで精度の高い画像を生成してくれます。
ラウンドも終盤に入り、少しダメージを負いながらも激しい攻防がおこなわれている様子が、よく描写されていますね。
ImageFXは、画像内にテキストも入れられるので、今回はウエストバンド部分に「ABC」ロゴを入れるよう指示しました。
問題なく、テキストが画像に反映されています。
では最後に、日本の国技である「相撲」をテーマに画像を生成してみましょう。
できる限り、精度の高い画像を生成するために、ImageFX用のプロンプト生成用に、ChatGPTで「ImageFX Master」というGPTsを作成してみました。
状況や、カラートーン、装飾、オブジェクトの特徴や人種、性別など細かく会話形式でヒアリングしてくれるGPTsです。(もちろん誰でも無料で使えるので、ぜひ試してみてくださいね)
最初に「ImageFX Master」に以下のシンプルなプロンプトを投げてみます。
「日本の国技館のような会場で、力士が白熱した取り組みをしている」画像を生成します。
その後、「ImageFX Master」で会話形式で質問に答えることで、以下の長文プロンプトが生成されました。
Create a high-resolution, dynamic scene of a sumo match at Japan’s iconic Kokugikan arena. The focus is on the moment when a veteran yokozuna executes a dramatic throwing move against a young, up-and-coming rikishi. The scene is captured from a slightly pulled-back, diagonal angle above the dohyo. Both rikishi are wearing simple mawashi, covering only the waist and hips, rather than elaborate ceremonial mawashi, emphasizing their physical power and focus on the match. The packed audience, seated on traditional cushions, can be seen in the background, filled with excitement and energy, watching the match intently and cheering passionately. The traditional canopy and curtains above the dohyo are visible but not the main focus.
Lighting highlights the dohyo with strong spotlights, while the rest of the arena is dimly lit. The texture of the sand on the dohyo and the sweat on the rikishi’s skin are captured in vivid detail, emphasizing the intensity of the moment. The overall mood is one of intense excitement, with the audience roaring in approval, creating a sense of overwhelming noise and movement. The camera captures this scene using a standard lens from a slightly elevated perspective, balancing clarity and immersion without being too close.
The colors and background tones are left to the artist’s discretion, with a preference for vibrant, lifelike tones to enhance the sense of realism. The audience is dressed in typical autumn attire, reflecting the seasonal setting.
(日本を代表する国技館での大相撲の取組を、高解像度でダイナミックに表現。ベテラン横綱が新進気鋭の若手力士を相手に劇的な投げ技を繰り出す瞬間にフォーカス。このシーンは、土俵の上の少し引いた斜めのアングルから撮影されている。両力士のまわしは、凝った儀礼的なまわしではなく、腰とおしりだけを覆うシンプルなもので、身体的なパワーと勝負への集中力を強調している。伝統的な座布団に座った満員の観客が、興奮とエネルギーに満ち溢れ、熱心に試合を見守り、熱い声援を送っているのが背景に見える。土俵の上には伝統的な天蓋と幕が見えるが、主役ではない。
照明は強いスポットライトで土俵を照らし、アリーナの他の部分は薄暗い。土俵の砂の質感や力士の肌の汗が細部まで鮮明にとらえられ、その瞬間の激しさが強調されている。全体的な雰囲気は激しい興奮に包まれ、観客の歓声が響き渡り、圧倒的な音と動きが感じられる。カメラは標準レンズを使い、やや高めの視点からこのシーンをとらえ、近づきすぎず、鮮明さと没入感のバランスをとっている。
色や背景の色調はアーティストの裁量に任されており、臨場感を高めるために鮮やかで生き生きとした色調が好まれている。観客は典型的な秋の装いで、季節の設定を反映している。)
これをImageFXに指示してみましょう。
臨場感が伝わってくる、いい画像が生成されてきました。
「相撲」や、「客席の座布団」、「客層」の理解度がとても高いですね。
こりゃ、すごい。
一応、失敗例も。
これはこれで、とてもユニークな1枚にはなってますが、あり得ない跳躍力と、客席との温度差がリアルではないですね(笑)
生成AIならではの1枚にほっこりしました。
やはりImageFXは、国や文化に対しての理解度が、とても高いということがわかりましたね。
おわりに
今回は、Googleの画像生成AI、ImageFXの使い方や作例について、解説してまいりました。
無料でハイクオリティな画像を生成できることが、お分かり頂けたのではないでしょうか。
僕自身、2022年秋頃から様々な画像生成AIを使ってきていますが、プロンプトの理解度、再現度に関してはImageFXが現状トップだと感じました。
つくりたい画像が明確に決まっている人、アート性よりも、リアルな画像をつくりたい人にとっては、ImageFXがおすすめです。
「Midjourney」や、ChatGPTで使える「DALL·E 3」、無料で使える「Leonardo AI」などの生成AIツールも、日々進化しています。
新しい生成AIもどんどん登場してくるでしょう。
今後もこのchannel IVYでは、生成AIの深掘り記事を出していきますので、お楽しみに。
では、また!