Stable Diffusionで LoRAを使ってみたりして AIイラスト三昧

あなたは 人目の訪問者です。
あなたは 人目の訪問者です。
2023年 9月10日(水) 晴れ
ChatGPT
ChatGPT
ブリトーと午後の紅茶ミルクティー。
IMG_2227.JPG
午前 こんまりモードで必死で片づけるのをやめたので、きのう(金曜)の朝から、睡眠導入剤を飲んでいても、夜中に目覚める激痛が、影も形もなくなり、きょうも、痛くも痒くもありませんでした。
身体表現性障害は脳が錯覚して、あちこちに痛みを感じる精神疾患です。 痛いときは、何もせずに寝ていれば、すぐに治ります。
ドトールでシナモンロール、アイスコーヒー(S)。
IMG_2228.JPG
午後 きのうは自宅Win 11 PCにPythonが動くようにして、Stablle Diffusionで テスト的な AIイラストを生成して、生成時間を計ったら、1枚の生成に 1秒ちょっとでした。

AIイラストは、いろんなジャンルの絵を学習させた学習モデルを指定して、描きたい絵を生成します。 世の中には、膨大な数の写真や漫画や絵画などがあり、それら全部を学習するなど不可能だから、車なら、車ばかりを学習させた学習モデルを作り、それを指定するわけです。 全方位的に、ネットに転がっている画像データを片っ端から拾って学習させると、人口が多い国ほど多くの画像データがある傾向があるので、人物だと、欧米人や中国人の画像が多数派になった学習モデルができます。 でも、日本人は、日本人を描きたいですよね。 アジア系、日本人、などのローカルな学習モデルができていますので、それらをえらべばいいわけです。

でも、「日本人のきれいなおねえさん」の学習モデルを使ったとしても、「推しのおねえさんに似た日本人のきれいなおねえさん」というのがあれば、コミケのお宝モノです。 Stable Diffusionでは、推しの画像を追加学習させて、推しに似た画像を生成するしかけがあり、LoRA(Low-Rank Adaptation)と呼ばれていて 100種類以上あります。

例えば、学習モデルに「chilledReGenericV3_v10」を使って、きれいなお姉さんを生成すると、こういう絵が出ます。
00005-749463473.jpg
ここで、LoRA(Cute Asian Face)をインストールしてプロンプトで指定すると、同じSEED値で、こんなふうに変化します。
00006-749463473.jpg
同じく、LoRA(JapaneseDollLikeness_v15)を適用すると、このように変化します。
00007-749463473.jpg
AIイラストはプロンプトが肝なんですが、そのプロンプトで指定する学習モデルを、たーくさん、PCの中にインストールしておかねば、プロンプトだけでは思うようなAIイラストになりません。

ファミマの、竜田揚げ弁当でした。
追伸 ところで、数年前にトランプ大統領のフェイク画像がSNSで拡散しましたが、元ネタ画像があれば、AIイラストで簡単にフェイク画像を作れます。 例として、SSブロガーさんの飼い猫ちゃんが空中を飛んでいるフェイク画像を生成してみたら、こうなりました。
00010-1312049082.jpg

あしたは、ピクミンブルームのコミュデイ(2日目)に参加して、1万歩歩いてきます。 最近、1日 2,000歩ぐらいしかあるいていません。

コメント

  1. HOTCOOL より:

    おへそもリアルでいいなー^^

  2. ぽちの輔 より:

    データを蓄積する作業が大変そうですね^^

  3. 夏炉冬扇 より:

    ジャンプの猫か゛面白い。
    「痛みと脳」。仕組みが不思議と思いました。

  4. とし@黒猫 より:

    > HOTCOOL さん
    AIは無から有を作れないので、何かで学習した画像の一部なんでしょうね。

  5. とし@黒猫 より:

    > ぽちの輔 さん
    データというか、AIの学習モデルです。 モデルといっても、方式によって、今回のLoRAの他、VAEとか色々あって、フォルダを分けて管理しないと、とにかくファイルの数が
    多いです。

  6. とし@黒猫 より:

    > 夏炉冬扇 さん
    「飛ぶねこ」は、生成AIでも破綻した画像を生成することが大半なので、20枚ぐらいバッチ生成したうちの1枚です。

  7. mayu より:

    空を飛ぶ猫
    毛並みも眼の光も、リアルですね(*’▽’)

  8. 横 濱男 より:

    AI女の子、顔がデカいね。。(^▽^)

  9. tommy88 より:

    個人的には復帰がパキッと割れている女子が好きです。
    出来たらそういう女子をAIさんに描いて貰いたいです。
    なんてね。
    と、さて、猫さんはどこを翔んでらっしゃるのでしょうか。
    室内、新幹線の客車内かしら。

  10. みぃにゃん より:

    ワンコのジャンプはよくみますが猫ちゃんはなかなかないですね~珍しい~

  11. トルティーヤは、ボリュームがあって、腹持ちしますね。

  12. とし@黒猫 より:

    > mayu さん
    猫は空を飛ばないので、この絵を出すのに苦労しました。
    ガチャ的な要素が大きいので、「まあ、これならいいっかー」という画像が出るまで、100回ぐらい生成する覚悟が入ります。
    わたしは自宅PCにAIイラスト生成環境を作っているので、生成回数はノーリミットです。サイコロで 6が続けて3回出るまで投げ続ける、とか、そのぐらいの確率です。

  13. とし@黒猫 より:

    > 横 濱男 さん
    LoRAの追加学習をした人が、日本人のグラビア写真集を学習しまくったんだと思います。
    なのでLoRAを使った生成画像には著作権がないし、商用利用もできません。

  14. とし@黒猫 より:

    > tommy88 さん
    生成AIは、学習モデルを元に近いものを確率で選んでいくので、そもそも学習していない「猫が空を飛ぶ」というプロンプトは生成AI的には破綻しています。
    なので、宇宙ステーションなどの重力が地球より小さい環境でジャンプしている絵で妥協しました。

  15. とし@黒猫 より:

    > みぃにゃん さん
    猫が長距離ジャンプする画像をAIが学習しているとは考えにくいので、犬がドッグランで長距離ジャンプしているシーンを猫に置き換えたのかもしれません。
    生成AIは、「飛ぶ」というプロンプトから大雑把に構図を作り、最後のディテールを犬ではなく「猫」にしたのではないかと思います。

  16. とし@黒猫 より:

    > ヨッシーパパ さん
    ブリトーは、セブンイレブンでした。ファミマは、トルティーヤですね。

  17. みずき より:

    空飛ぶネコ、なんか新宿の3Dネコを
    思い出しました(^^♪

  18. とし@黒猫 より:

    > みずきさん
    新宿の3Dモニターのねこはインパクトがありますよね。

  19. とし@黒猫 より:

    ********************
    Stable Diffusionで LoRAを使ってみたりして AIイラスト三昧 の
    ブログ記事に、たくさんのコメントをいただきまして、
    ありがとうございました。
    ********************