生成AIを使った画像制作は、キーワードやフレーズが重要です。いわゆるプロンプトです。意外な画像が出てくるのは、楽しみではあります。しかし、アートな作品作りは別として、それでは、ビジネスでは使えません。
この先、食べ物や人物、機械などに特化した 生成AIが出てくるかもしれませんが、今は、この楽しくもやっかいなAIと付き合うしかありません。
そこで、今回思った通り、もしくはそれに近い画像の出し方を説明します。使用したのはChatGPT PLUS(有料版:月20ドル)で使えるDALL-E3です。
生成AIの画像制作は素材認識からはじめる
ChatGPT(DALL-E3)を使った画像生成で、これまででわかったことがあります。それは、New chatにしないと、それまで作成した内容に強い影響をうけること。これは文章生成やデータ分析、あるいはコード制作と同じ。つまり、その性質を利用して、認識のステップを積み上げながら最終目標に到達するのです。今回、テーマにしたのは、『さつまいもを素揚げした究極のさつまいもスイーツ』です。
生成AIに究極のスイーツを作成してもらう
世間ではさつまいもブームが起こっており、さまざまさつまいもスイーツが連日のようにSNSを賑わしています。見た目はさつまいもから脱却しているものもあり、一見してわからないスイーツもあるほどです。ここでは、シンプルながら自然の素材のみで作成したスイーツの再現を目指します。
生成AIに対象物を認識させる-さつまいもの画像生成
広告の後にも続きます
なにはともあれ、まずはイモの認識が大事だと次のようなプロンプトを作成して入力しました。
「皮を剥いたさつまいも」
出てきた画像は、外観こそ、さつまいもですが、人参のような断面であり、さつまいもとは程遠いもの。ひょっとしたら「海外ではさつまいもはこうなの?」と思い、次のプロンプトを入力しました。
日本のさつまいもでお願いします。
すると上の画像のようなさつまいもが出てきました。皮を剥いた、さつまいも、と判断して、剥いた皮とイモの断面なのでしょうか?背景の和室には言及せず、とりあえず、中はさつもいもぽっくはなりました。しかし、完全に剥いたわけではありません。そこで次のプロンプトです。
全ての皮を剥いたさつまいもを白いお皿に乗せて上から撮影してください