生成AIはアシスタントみたいなもの

 自作のスクリプトにイラストを付け加えてみると華やかでわかりやすいと感じたので過去のスクリプトにもイラストを付与してみることにした。

「ベトナム語文法変換09」は「〜しないで」なのでお母さんが男の子に「お菓子を食べないで」という感じの絵にする事にした。

Niji journeyに"お母さんが子供に命令している 子供はお菓子を食べようとしている --niji 5 --style cute"

と命令文を与える

するとだいぶ想定外の絵が出力された


その後、似たような命令文をちょっとずつ変えながら5回出力させてみたが、どれも希望とだいぶ違う絵が出力されていた。
6回失敗したらさすがに命令文を変えなければならないなと思い変更
「お菓子」は抽象的すぎて結果にバラ付きが出ると思い「クッキー」と具体的な名称に変更、さらに食べようとしているも抽象的な感じなので「手を伸ばしている」に変更

命令文"男の子はクッキーに手を伸ばしている お母さんは食べないでと言っている"

お、だいぶイメージに近づいてきた
やはり具体的な命令が良いようだ
手を伸ばすで子供の描画が良くなってきた。
お母さんが微妙だったり居なかったりしているのでお母さんの部分をもっと具体的にしよう。

命令文"男の子クッキーに手を伸ばしている お母さん後ろに立って話しかけている"

お、右上が狙ったイメージにかなり近い! これで良いんじゃないかと思ったけど、男の子の指が4本だった

右上をベースにバリエーションを作成してみる

・・・どれも指が6本だったり4本だったり不自然

この後4回繰り返したのだけど、どれも駄目だった

どうもNiji journeyもMidjourneyも指が苦手らしい。
正解に近づいているのに指がどうにも不自然である
これだけ繰り返して駄目だとこれ以上繰り返しても駄目だろう。

と、言うことで私は生成を諦めた。
まぁ、私は絵を描けないわけではないので、自分の手で描き変えてしまう方向に方針転換した。
iPad proでMedibang Paintを起動し、まともそうだけど子供の左手が4本指の画像を読み込ませる


上位レイヤーを追加してApplePencilでちゃちゃっと指の位置をずらし指を5本に書き換えた。
するとこの様に子供の指は5本になりイラストとして掲載可能なレベルに改善

Google図形描画で吹き出しを追加して完成!
「Con đừng ăn bánh kẹo(お菓子を食べないで)」

何度も何度も生成を繰り返すよりさっさと自分で描き変えてしまったほうが良かった。
生成AIへの命令文(プロンプト)はもっと工夫できるはずだから、そちらももっと練習すべきだけど、AIに完全を求めずに自分で直してしまうのは時間対効果が良いと感じる。

スクリプトのテーマに合う画像を毎回全部手で描いていたら時間がかかりすぎてスクリプトを作る気力も失われてしまうかもしれないけど、生成AIでお手軽に画像を生成し、自分で直してしまえば短時間でスクリプトのテーマに沿ったイラストを付与することが出来ると思った。

生成AIは言わばアシスタントみたいなもので、自分が理解している事についてなら生成を任せると出来上がったものの良し悪しを判断できるし、直すべき場所があれば自分で直すことも出来る。
そうして省力化を行うことで自分の時間をもっと別の部分に使うことが出来る。
ChatGPTやGoogle Bardのようなテキスト生成AIも同じで、自分が理解しているJavascript等のプログラム生成に利用すれば生成されたプログラムの良し悪しを理解できるので直すべき場所があればこちらもさっさと直す事で工数を大幅に削減できるだろう。

まだこれから色々と検証する必要があるけど、生成AIをうまく利用することで自分のやりたいことの幅や規模を大きく広げる事が出来そうに思える。



コメント

このブログの人気の投稿

Googleスプレッドシートの正規表現置換で改行文字

名作と定評のあるスーパーファミコンの『ザ・モノポリーゲーム2』を今更ながら遊んでみた

Googleスプレッドシートのimportxml関数をhtmlに使う