投稿

1月, 2024の投稿を表示しています

スターフルーツと画像生成AI

イメージ
 ブログに記していないが、スクリプトの開発、公開は続けている。 最近では神経衰弱のような絵合わせゲーム「 ペアカード(飲み物) 」を公開した。 これもJavascriptの練習を目的とした単純なプログラムであるが、飲み物の画像を付け、ベトナム語の単語を表示するようにすることで遊びながら単語を覚えるというコンセプトにした。 当初はベトナム語のみであったが、日本語を学習している人にも役に立つように日本語表示も追加した。 カードの画像は昨年からのテーマである画像生成AIを用いている。 ベトナム語変換スクリプトの画像では最近DALL-E3を用いて生成した画像もあるが、ペアカードでは裏面のみDALL-E3で表面の飲み物画像は全てNijiJourneyによって生成している。 画像とテキストを入れ替えれば他の単語の学習にもなるので、次は果物編を作ろうと思い、ベトナムらしい果物5つと世界的に食べられている果物5つを選んで生成を開始した。 いちご、リンゴ、マンゴー、ドリアン、この辺りはなんの問題もなく生成される。 2番めに苦労したのはパパイヤ、カットしていないを指定してもカットされた画像ばかり生成されてしまう。たしかにGoogleでパパイヤを検索して画像を見るとカットした画像ばかりが表示されるので、こうした画像を学習データにしていたらカットした画像ばかり生成されるだろう。 それでも何度か繰り返しているうちにカットしてない画像も生成されたので、それで良しとした。 1番苦労したのはなんといってもスターフルーツだった。 NijiJourneyではこんな女の子の画像が生成されてしまうし Mid Journey(v5.2)ではこの様にカットした画像が生成されてしまう DALL-E3ではこんな星型の謎植物が生成されてしまう これ、1回、2回ではなくて、それぞれに10回以上生成を試みてもまともな画像は生成されなかった。 唯一スターフルーツっぽいのはMid Journeyの V6[ALPHA]であった。 質感的に微妙ではあったが、他と比べれば明らかにマシなので、これで手を打つことにした。 ーーーーー2024/01/07追記 この画像はスターフルーツに見えないので結局ほとんど手描きした画像に変更した。どの様に描き換えたかは ペアカード第2弾 果物編 で確認 まとめ 昨今、画像生成AIを用いた画像をよく