Googleの画像生成AI「Whisk」が登場

みなさま、こんにちは。
今週は花粉症でティッシュが手放せない小松がお届けします。

最近、Googleが発表した新たな画像生成AIツール「Whisk」が注目を集めています。

Whiskとは、ユーザーが指定した複数の画像を組み合わせて、新しい画像を生成する次世代型の画像生成AIです。
テキスト入力型AIとは異なり、視覚的な要素を元に画像を作成することができます。

Whiskの大きな特徴

・テキストの代わりに画像をプロンプトとして使用
・Googleの大規模AIモデル「Gemini」が入力画像を分析し、「Imagen 3」が画像を生成
・「モデル(被写体)」「背景」「スタイル」の3つの画像をアップロードするだけで、直感的に操作が可能
・Googleアカウントがあれば誰でも利用可能で、手軽に試せる

AI特有の難しいテキストプロンプトが不要で初心者でも扱いやすいのがWhiskの大きな魅力ではないでしょうか。

実際に画像を生成してみた

まずは、Whiskのデフォルト画像のみを使用して画像を生成してみます。
Whiskの編集画面で、右側の黄色いエリアに「モデル(被写体)」「背景」「スタイル」の画像を設定します。

次に、黒い矢印マークを押して画像生成を開始します。生成時間は数~十数秒。

完成した画像がこちら

一瞬で、ドット絵のゲームのような画像ができました。

撮った写真を使ってみる

次に、「モデル」に実際の写真を入れて試してみます。

今回は、軽井沢で食べたハンバーガーの写真をアップロードしてみました。
「背景」は設定せず、「スタイル」を3D風(デフォルト)に変更して画像を生成。

すると、3Dモデルのようなハンバーガーが完成!
ゲームのCGのような仕上がりになり、Whiskの画像変換能力の高さがわかります。

いかがだったでしょうか?
Whiskは、AI特有の複雑なプロンプトを入力しなくても、直感的な操作で高クオリティな画像を生成できるのが魅力です。

デザイナーはもちろん、AI画像生成に馴染みのない初心者でも気軽に試せるので、ぜひ一度使ってみてくださいね。

それでは、また次回のブログでお会いしましょう!

The following two tabs change content below.
小松

小松