StableDiffusion: google colabやローカル環境で実行可能なAI画像生成
Midjourney: 有料サクで商用利用まで可能なAI画像生成サービス
(DALLE・Craiyon・NovelAIの話題もOK)
★★★ 注意 ★★★
ここは既存のAI画像生成サービスの”””具体的な”””技術や動向について語り合うスレです
漠然とたAI画像生成の未来や、イラストレーターの職権侵害等の一般的な話題は明確に【禁止】ます
(以下のスレッドへ移動てください)
【Midjourney】AI関連総合10【StableDiffusion】
https://mevius.5ch.net/test/read.cgi/cg/1665312817/
AIイラスト 愚痴、アン、賛美スレ part6
https://mevius.5ch.net/test/read.cgi/illustrator/1665161807/
テンプレまとめ
https://rentry.co/zqr4r
編集ード「5ch」
前スレ
【StableDiffusion】AI画像生成技術8【Midjourney】
https://mevius.5ch.net/test/read.cgi/cg/1665387634/
引用元: ・【StableDiffusion】AI画像生成技術9【Midjourney】
乙乙~
スレタイMidjourney→NovelAIでいいかもって気がてきた
MJの話もう誰一人てねぇ
次スレはここに入れちゃうか?
> (DALLE・Craiyon・Midjourneyの話題もOK)
スレ埋まってるの全然気付かなかったわ
Win32/Sirefef!cfgというウイルスです
その後焦ってファイルを右クリックで削除てまいまた。
ckptファイル自体はhddから移たりもせず未使用で、当然automatic1111でも使用ていません。
この場合パソンや外付けhddの感染ってどうなっているのでょう…
ダウンロードてもファイルを実行てなければ感染からは免れているのでょうか…?
実行ていないなら大丈夫(のはず)
偽陽性では?という話もあったりで、実態はよく分からない
https://huggingface.co/Deltaadams/Hentai-Diffusion/discussions/12
ぁあ怖い
感染の場合って、確認方法とかないのでょうか?
waifuは入れたがHentai Diffusionというのもあるのか。
ちなみに、
「輪○されて、白濁まみれでアヘ顔ダブルピースで体には正の字が書き込まれて、周囲にはゴムが散乱ているアラフォー奥さん」
みたいな呪文は可能ですか?
waifuじゃ無理だな
NnovelAIなら可能だろうけど
というわけでエロはこっちで
【NovelAI】AIエロ画像情報交換 5【Waifu Diffusion】
https://mercury.bbspink.com/test/read.cgi/erocg/1666041665/
なんJnovelAI部★62
https://fate.5ch.net/test/read.cgi/liveuranus/1666149743/
おふざけにマジレス超感謝www。
わかったわかった
そんなごまかさなくたっておまえさんがどんな性癖でもみんな笑ったりないから安心なよ
が、とりあえずもうやめとけ
うんこ漏らながら走ってたらそりゃあな
eatは基本的に手で引っ掴んでかぶり付くイメージ
ラーメンならsipとかslurpやね
・重要なデータを外付けストレージにバックアップ
・複数のスキャンソフトでシステム全体のフルスキャン(DefenderやらESETやら)
・わらわら検出されたらもう手遅れなのでPCシステムリカバリ(再インストール)
まぁ多分誤検知だと思う。data.pklじゃなくてテンソル格納部分のファイルからだ
何よりこれとは関係ない何も検知されないモデル同士をマージた新規ファイルからも
同じウィルスが検知される事あるんだよね
そりゃ面白くないポリレ団体や絵師は中身関係なくウィルス登録するわな
ダウンロードファイルをユーザーが実行ないと動き出さないか
ユーザーが実行なくとも時間差で勝手に動き出すのか
Win32/Sirefef!cfgを調べても初歩的ことなのか情報が全然出てこない
ここら辺分れば少安心できるのに…
>>17
data.pklじゃなくてテンソル格納部分のファイルからだ
それはどういう意味ですか?
最適化されてよわよわグラボでも動くようになってほい..
まじでヤられたって話になれば今頃そういう話題が出まくってるだろうに何もないから、
たぶん誤検知だろうとは思ってる。
とはいえスケベモデルは他にもあるから、心配ながらあえてhentaiを使う必要もないかもね
> その後焦ってファイルを右クリックで削除てまいまた。
これdefenderが●たんだと思う
知り合いがemotet踏んだ時に「警告が出てファイルが勝手に●えた」って言ってたので
落とたやつがあってるか確認するか無い
キャラを学習するときはそのキャラの特徴を●す必要あり
ありがとー!
これの意味が全く分からない、特徴を●す?
ネットで検索てもはっきり書いてるサイトない
どなたか教えてください
hypernetwork学習のときは、余計な情報を学習せないようにファイル名にその画像の説明を書く(書いた情報は学習ない)
画風を学習する場合は、例えば赤い髪、とか青い目、とかは学習てほくないからファイル名に書く
でもキャラを学習するときは、髪色目色含めて学習たいから、そういう情報をファイル名に書いてはいけない
説明を自動でつけてくれるツールはそういう情報を入れてくるので、手動で●さなきゃいけない
hypernetwork関連全部まとめた日本語サイト欲いよね
ありがとう
「学習させないのに書く」ってのがよくわからなかった、逆では?って
ファイル名(=プロンプトでいいのかな?)にあるからすでに指定済み=学習の必要ないって判断されるってことか
なるほど
既知かもれんけど意外と目から鱗だったので共有
prompt末尾にカンマをつけることで構図画風を変えずにやり直できる(たぶんWDでも効く)
こんなに変わるとは思わんかった
世の中そんなに都合いいわけないのはわかるよね
指の本数だけ違うとか、些細な部分が変わる数百枚の中に都合がいい物があるだけ
増長性持たせて再描画てるわけだから、自分が変えたくない部分ももちろん変わる場合もある(そっちの方が多い)
それ別に,じゃなくてもいい
ノイズの変化ってことだよね?
単体で意味の通らない記号ならなんでも
なんならimg2imgでも同じようなことは可能だろう
軽度…画風変更系のプロンプト(nendoroid, monochromeなど)が効きにくくなる
中度…全体的にプロンプトが効きにくくなる
重度…画像にノイズが走る、どんなプロンプト入れても同じような構図か出てこない
体感とてはこんな感じ
説明サイトによっては長方形とか形色々でサイズに関ても特に記述なく
枚数も数枚から100枚とか使ってる人いて、どれが最適なのかいまいちわからない…
とりあえずトリミングて全身から顔だけにて20枚弱にたけども、
これが正いのか正くないのか全然わからない…
あとやっぱ白黒の線画だけの画像は判別にくいのかなぁ
def model_hash(filename):
try:
with open(filename, “rb”) as file:
import hashlib
m = hashlib.sha256()
file.seek(0x100000)
m.update(file.read(0x10000))
return m.hexdigest()[0:8]
except FileNotFoundError:
return ‘NOFILE’
if __name__ == ‘__main__’:
print(model_hash(“model.ckpt”))
ちな、「models/Stable-diffusion」フォルダに複数モデルを入れてあれば
web ui起動中ならロードする前(切り替える前)に、左上に出てるよ
https://imgur.com/a/qmvOKV1
>>86 のードで一度、webuiにhash値は覚えられている
https://github.com/AUTOMATIC1111/stable-diffusion-webui/discussions/2468
実際は sd_models.py#L89-L99 あたり
https://github.com/AUTOMATIC1111/stable-diffusion-webui/blob/f894dd552f68bea27476f1f360ab8e79f3a65b4f/modules/sd_models.py#L89-L99
ラフの清書とかできるのはどっちなん?
openVinoでCPUで生成てる記事は見たことある
自分のノートPCのCPU使ってStable diffusion UI(cmdr)で生成するのよりはだいぶ速いタイムで書かれてた
自分はOpenVino試たことはないから速いのかは知らん
StableDiffusionの方も使いたくなり色々試たと
DreamStudioで生成される画像とseedとかの条件を一致させてもなんか違う画像が出てくるんだ
なんか原因わかる人おる?他の設定は
(Model hash: 7460a6fa, Clip skip: 2, ENSD: 31337)
でやっとる
>>50
そう、公式はデフォ設定が1.5になってる
1.4にすれば同じの出るよ
ただ1.4にても違うの出てくるんで、色々試てみるわ
https://i.imgur.com/JwZuWhl.png
https://i.imgur.com/W3fVZLm.png
clip skipじゃね?
NAI設定で2にてるようだ
あざす!!!
完全に一致たやつ出せた!!
括弧って何の意味があるんですか?
NAIがどういう仕様かは知らんけど
なるほど、括弧の数が多いほど括弧の中が強くなっていくんですね
まあ元素法典のクオリティアップ系のタグ重ねそんな機能てるとも思えんけどね
エフェクトっかり指定するほうが大事
俺はVRAMが貧弱すぎて試せない
https://github.com/ShivamShrirao/diffusers/tree/main/examples/imagic
ローカルのVRAM足りん暇なときにcolabで試てみるか
学習はどうやら8GB無いと駄目そうなんだが、colabとか使って学習済みptを
作りさえすれば、それを使った画像生成はVRAMが3GBのままmedvramで起動ても
使えるってことで良いんだろうか?
生成結果が全然違うものになって役に立たないとかある?
あくまで学習に必要なVRAMが多いだけ
そうか…ありがとう
VRAM豊富な知り合いに自作絵の学習てもらったptを使っても全然
画風が似ないからmedvramのせいかと思ったんだけど、
単にプロンプトが悪いだけかもれんな
DBで学習済のモデルを使った出力をて差異が殆ど無いことが確認できた
知り合いとの環境差異による出力差はあるだろうけど、
画風が認識出来ないほどのものではないだろうから要因は別にあると思う
マジか、実際あまり使い方が分かってない感はあるんだけど。
やることってSettingsタブのStable diffusionのHypernetworkでptを選んで
strengthを調整するくらいだよね?
するとtxt2imgに適当にプロンプト入れて生成される画像が
そのptの画風になるくらいの認識だが。
strengthの下のェックボックスもちょっといじってみるか…
使い方有っとるぞ
applyてないという落ちでもなければ、後は渡されたモデルが違うか学習出来てないかかないと思うな
ソースはこのミット
https://github.com/runwayml/stable-diffusion/commit/4eb9692d3fd0c71260f2bc5b2a7e858233737f7f#diff-a4d20bf92713d027e2f325fa6f6ec01d8ce3e39dc9f381afada6d5a1fa8bd0a2R107
https://asahi.5ch.net/test/read.cgi/newsplus/1666177481/
自分も低RAMグラボなのでDBか作れてないけれども
ぜんぜんできるよ
1111が対応てくれてるので簡単
Twitterで公開されてるpromptのALTをそのままピペて設定も同じにても似てる絵が出てくるどか変な絵か出てこない
これって俺がNMKDを使ってるからいけないの?それとも何かもうひとつ行程が必要なのか?
NMKDのスクリーンショットを見せてくれたら、ここはこうするとか指摘できるかも
>>89
レスありがとう
スクリーンショットを見せるまでもなくNMKD独自の仕様が原因っぽいなこれ
頑張って1111を入れてみるわ
NMKDからスタートてweb-uiに移行た者だがNMKDは普通のプロンプトとネガティブプロンプト合わせて55ワードで納めろって仕様らい
あとネガティブの指定は[]で囲む
一般に貼られてるプロンプトはweb-uiの仕様でプロンプトとネガティブプロンプト別計算で75トークン入れられて
[]で囲むんじゃなくて別の入力欄があって色々細かく長いプロンプト設定ができるのでweb-uiがおすすめ
ワイは最初WEBで扱えるdiffusionで楽んで、
次にNMKDに入ったが散々待たされた挙句cuda入れてくださいでストップされたのでNMKDは許さない
次に試たcmdr2がその点あっさりクリアできて良かった
その次に試た1111とクオリティの違いに唖然とはたが
1111が導入に一番手間があったというか、色々な記事を散見て回って導入すると沼にはまる
どうせ何百回とやったうちの奇跡の一枚でょって思って半信半疑でプロンプトピペて生成たら次から次へと良作画が…
これは凄いと感動するレベルの絵は10枚に1枚くらいだけど、神絵師作画が10回に1回の確率で排出されるガャ楽すぎだろ
6個中4個が同じモデルハッシュ値でシード固定たら同じものが作られちゃいます…
fp16に限れば5個中4個が同じハッシュです…
それぞれ別の日に違う画像でcolabで作ったものなのに、なぜ同じ中身に……
これは一体どういう現象なのでょうか?…
使ったノートは一番有名だと思われるShivamShrirao氏のものですが…
最終的には同じ絵柄で存在ない組み合わせを自動生成できるようにたい
Dreamboothに全パターン突っ込んだら結構うまく行ったけど、アクセサリーが変になったりケモ耳が片方だけ生えてたりと細かいとがちょっと変な感じになる
各パターンをDreamboothで学習させてモデルマージすればいけるか…?
dreamboothで個別に覚えさせて融合を試みる方法(できるかは知らん)
hypernetworkで差分になる要素のワードを画像ファイルのプロンプトに入れて、そのワードが入ったときだけ再現する方法
この二つかな
hypernetworkは新規に何かを覚えるものじゃないのでプロンプトで再現できる範囲でかなんとかならんけど
プロンプトに入っていない→無条件に再現させるものとて学習(プロンプトの主語とかに全部ぶら下がる)
プロンプトに入っている→そのワードが出たときだけ再現させるものとて学習
という風に振り分けができる
dreamboothでまとめて覚えさせた後にそのモデルに対てhypernetworkで描き分けを学習させるなんて手法もあるかもれないが例は見たことがない
kanewallmannフォークで個別要素を同時に学習できるらいから試てみたら?
オリキャラ10人に別々のキーワード付けて組み合わせたり出来れば理想的だけど
正攻法は ノーマルキャラをDB → 同じモデルに対てwithケモミミでDB → 同じモデルに対て・・・
或いは二度目のDBの時にプレースホルダ付きクラスを学習時のクラスとて扱うのか?
add layer normalization という項目が追加されてるのだけど、なんだこれ?
https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/3086
layer structure 1,2,1で今まで通りらい
layer normalizationにェックを入れると学習が安定すると書いてある
MJかDALLEのどっちかが漏らやがったな・・・
音楽AI?
記憶違いじゃなければautomatic1111更新てxformers実行てから一枚絵でも●費電力が非常に高いになってまった気がます。
xformersをオフにても初期のサイズで出力ても非常に高いのまま…
設定で●費電力抑えることは可能でょうか?
●費電力調べずでRTX 3080 12GB入りpc買ったの後悔てます…
afterburnerでpower limitかtemp limitあたりを下げたらいいけど、当然遅くなる
か電力を気にする環境の人がハイエンドグラボとか、なんのこっちゃって話ですよ
そやから後悔てる言うてるやん
どうても抑えたいなら、GPUのアプリで制限かけてまえばいい
生産速度はもちろん落ちるが
いろいろ試てみてうまく行ったら報告ようと思います
性能をキープながら省電力化できると謎の満足感が得られる
RadeonユーザーdirectML使用は相変わらず修正が必要だけど。
なるほど、アプリの設定で●費電力を抑えられるのですね…!
無知な質問ばかりなのですが、その設定によっては●費電力を3080〜3060くらいの電力に抑えることも可能なのでょうか?
そうた場合の生成スピードが遅くなるのは分かるのですが、3060と同じくらいのスピードは出せたりするのでょうか?
こちらの設定はafterburnerの設定ですか?
もうスレ違いだからググれ
GPU-Zで測定ながら自分で試せ
その分グラボをフルパワーで回て画像製作させれば暖房代浮くだろ
Waifuも既に忘れられてるよな
つってもそれぞれの専門スレは結構細く長く需要あると思うぞ、このスレもハードや設定関連に特化てる
J本スレは流れ早すぎて逆に特定の話題のログちゃんと辿るの不可能だ
1-4が出ているのよな。試ていないが。
cmdr2で試てからの1111で試てどう違うかやってみるかのう
学習に使ったのと同じツールを使わないといけないみたいだけど、
例えば普通にautomatic1111で学習させたやつと、
流出たNAI+automatic1111で学習させたやつって違うツール扱いになるのかな
ちょっと分かりにくいか
つまりはautomatic1111ってとこは共通でも、ckptが違うと学習は反映できないってことになるんだろうかって意味です
なんのckptで学習たか分からないptが手元にあって悩んでる
スレ違いなのにみんな親切で感謝感激…
またググッてみます、ありがとうございまた
train_imagic.py: error: unrecognized arguments: black hair, wearing parka, neck accessary.jpg
Traceback (most recent call last):
File “/usr/local/bin/accelerate”, line 8, in
sys.exit(main())
File “/usr/local/lib/python3.7/dist-packages/accelerate/commands/accelerate_cli.py”, line 43, in main
args.func(args)
File “/usr/local/lib/python3.7/dist-packages/accelerate/commands/launch.py”, line 837, in launch_command
simple_launcher(args)
File “/usr/local/lib/python3.7/dist-packages/accelerate/commands/launch.py”, line 354, in simple_launcher
raise subprocess.CalledProcessError(returncode=process.returncode, cmd=cmd)
subprocess.CalledProcessError: Command ‘[‘/usr/bin/python3’, ‘train_imagic.py’, ‘–pretrained_model_name_or_path=hakurei/waifu-diffusion’, ‘–output_dir=/content/stable_diffusion_weights/imagic’, ‘–input_image=/content/stable_diffusion_weights/imagic/girl,’, ‘black’, ‘hair,’, ‘wearing’, ‘parka,’, ‘neck’, ‘accessary.jpg’, ‘–target_text=a girl eat hamburger.’, ‘–seed=3434554’, ‘–resolution=512’, ‘–mixed_precision=fp16’, ‘–use_8bit_adam’, ‘–gradient_accumulation_steps=1’, ‘–emb_learning_rate=1e-3’, ‘–learning_rate=1e-6’, ‘–emb_train_steps=500’, ‘–max_train_steps=1000′]’ returned non-zero exit status 2.
ノートブック
https://colab.research.google.com/github/ShivamShrirao/diffusers/blob/main/examples/imagic/Imagic_Stable_Diffusion.ipynb#scrollTo=jjcSXTp-u-Eg
原因わかったら教えてください
「Upload your 1 image by running this cell.」
のとこで、カンマや空白なの短いファイル名を使ってみて
もやtrain_imagic.pyへの INPUT_IMAGE の入力で
「~parka, neck accessary.jpg」ってへんなファイル名が原因な気がする
blackhair.jpgとかtest.jpgとか手短なのに変えてみよう
できた!ありがとう
そてこの技術、なんか結構すごい
ハンバーガーは食わせられなかったけど画風の再現度は比較的高くて構図と顔のバランスは完璧
多分ピースサインとか服替えくらいなら、は、トレスじゃない程度に変化させつつできる
ワイ更新ていないけどパーセント表示やなくて?時間?
だったら更新てみるか
こういう小業をおろそかにないあたりが、1111の支持される理由だよなあと思う
開発者じゃない誰かが作って、取り入れてよとプルリクエストを出たのかもれない
オープン開発の強みだね
少でも手を抜いて楽ようとするDeep Learningの性質が可視化されてておもろいな
これだけ手抜きようとするバイアスが強いと複雑な構図は当面難いのかもれん
手抜きじゃなくてpromptと学習データに忠実なんだよ
逆にpromptを作ってる人間が手抜きてると言った方が良い
アスペだと思って説明するのが良いのかもな
現実的にはi2i。t2iでがんばりたいなら学習
指だとマニキュアを塗っておくといいって聞いたな
試てないからどのくらい効くのかは不明
layer structureはこの人がPR出たンタクト取ってみては
https://twitter.com/5chan_nel (5ch newer account)
か箸をなかなかちゃんと持ってくれない
3本以上の箸はざら、正い持ち方はまず無理
https://i.imgur.com/4CISLBR.png これがわりとすぐ出てきたので油断た
https://i.imgur.com/jk5kR1O.png うまく食べてるようで全然うまくいってない
https://i.imgur.com/yOenCsE.png 口元で箸と麺がごっちゃになっている
https://i.imgur.com/j66KdgJ.png どんぶりから割り箸?メンマ?が立ち上がっている
https://i.imgur.com/JBSlM3y.png 箸の処理がとにかく難いようだ
https://i.imgur.com/6MFotqv.png 麺の前後関係がいろいろおかい
https://i.imgur.com/i7ao4wt.png 「この味は…お父さん…!?」
https://i.imgur.com/JptiIOZ.png 箸の持ち方はともかく麺のすすり方が一番よかったのがこれ
https://i.imgur.com/Ylhzm8m.jpg プロンプトがある程度固まったとで36枚連続で出てみたもの。打率の低さがよくわかる
箸大量に持つのはもうデフォだslurpですすらせても7枚目みたいな舌みたいな物体口から出てるのばっか出て麺すすってくれないわ
やっぱりAIはこういうの出すときが面白い
いやいや、これは>>132と同じで、Stability AIのアカウントじゃないでょ
比較て作っても絵柄は一緒で細かい部分か変わらずどっちが良い悪いとかなかったけど
画像という物の性質的に、fp32だから綺麗で正い、fp16だから粗悪で間違いというわけではないからあんまり気になくていい
このseedとpromptならfp32版がいいなってのもある、その逆もありうるからね
そもそもAUTOMATIC1111はfp16でか読み込まないからfp32は無意味って聞いたよ
オプションで「–no_half」使えばfloat32で読み込むことはできるらい
指定ないとデフォルトはtorch.float16になるんで
基本fp16でか読み込まないって話になるのかも
ソースはsd_models.py
github.com/AUTOMATIC1111/stable-diffusion-webui/blob/f894dd552f68bea27476f1f360ab8e79f3a65b4f/modules/sd_models.py#L177
まあ、ぶっちゃけ品質に大差はないきがする
服の柄とか装飾が少だけ変わったり、僅かに違う絵が生成されたりする
なんか普通だな…
単純に同じ32ビットのデータの受け渡でfp16はfp32のほとんど使われない小数点以下の23bitを中心に思いっきり詰めて
倍の速度で演算ようっていうやり方なの
膨大な演算の中で演算中に捨てられていく小数点以下で多少の誤差はあるけど見た目でわかる範囲ならもっと話題になってるよ
見た目で差がわかってもfp16/fp32でこっちがいいっていうのはあるだろうけど、どっちが正いというものじゃないからねぇ
古いgpuでfp16の方が32よりも遅いのがあるかどうかは知らないけど、sd関連でよく言われるfp16の選択はそもそもvram節約のため
遅かろうがcpu使うよりは爆速だから問題ない
出力するのが静止画であって学習は動画で行う必要がありそうだ
なんなんだろう
6枚を左右反転させた12枚で30000ステップさせたけど「無い方が良くね?…」って結果になって悲い
5枚とか少ない方が良いとか100枚以上読ませたほうが良いとかあって混乱
学習率によるけど30000は多い
20枚、5e-6で1500、5e-7で10000が相場って言われてるけど細かいとは微調整かな
5e-6でいい感じになるまでやってから5e-7で追加で回すみたいな
多かったの?!!
初期設定が10万だから足りないのかと思った…
5e-6だから1500程度で良かったなんて…
過学習てやつになってんのかぁ…
それなあ、公式じゃないんだよなあ。でも中身はほぼ公式みたいなんだよなあw
半公式みたいな感じ
https://huggingface.co/runwayml/stable-diffusion-v1-5/discussions/1
この辺手動で設定てた頃の情報が全部ノイズになってるな
https://www.reddit.com/r/StableDiffusion/comments/y99yb1/a_summary_of_the_most_recent_shortlived_so_far
よくわからんけどemad曰く問題ないらい
https://six-loganberry-ba7.notion.site/22-10-19-Infinite-Loops-Emad-0ed3ad9d479944f3bfbc1e51763a4e04
広まってくれるならなんでも許される気がする
どこか設定間違ってる?
https://imgur.com/a/dS1QZWX
https://imgur.com/a/W34VLIR
Restore facesのェック外てみ
ワイ初期値でか触っていないけれどそれもやな
今ワイ環境ェックたら
txt2imgタブのRestore facesもェック外れてるからそれもや
そういやおれ俺GFPGANいれてねーな
というか導入の記事みててGFPGANいれろなんてなかった気が
いや、1,4を入れるなんてのもあったことはあったが
入れないことで窓アスカじゃないものが出力されるんだろうか
なおCPUで動かす場合だが
むりか
というかハローアスカの●はENSDの設定値を初期値0にておくことimg2imgでオイラー設定にておくことだからな
レイヤーを2にってのはよく見かけるけれど、それよりもオイラーよ
NAIの標準であるオイラーaに準じてならアスカ出力後にENSDの数字変えてオイラーaにする必要がある
この設定みてるとできてるんじゃねとか
あと忘れがちなのがapply settingsを押て確定ておくことか
>>156
GFPGAN抜いて
vae.pt入れ直たらハローアスカできたわ
助かったありがとう
おっと、リロードてなかった…
なるほど、逆に考えると1111の導入なんかの記事でGFPGAN入れろとか書いてるのは
ハローアスカの再現する場合にはよろくないのかもな
1111の記事かimugerの記事のハローアスカの記事ではGFPGANの事は記されていないはずだ
ハローアスカで再現できたらいろいろカスタムてねってことでGFPGAN入れればいいだけで
GFPGANはハローアスカにはまったく無関係やで
むろ入れておいてもなにも問題あらへん
というかAutomatic1111使う人はほぼ必ず入れてる
CPUだけで動かてひーこらてるから余計なの入れて重くたくないなぁって思ってたんよな
画像がでてくるまでもすげー時間かかる
でもまぁ、そういうことならとりあえず入れておくか
使わなけりゃ
settingでGFPGANにェックいれてなければいいだけってことやろ
Dreamboothだと細かいキャラの雰囲気とかがいまいち再現されなくて困ってたけどこれするとかなり似るわ
学習ステップはかなり少なくて良さそう
AIちゃん「うっひょー!あばばばばhq54ぽj」
Troubleshoot Common “Hello Asuka” Errors (Euler)
https://imgur.com/a/DCYJCSX
必要なデータは全部オンメモリでないとあかんみたいな話どっかで見た気がするから
ckpt読込はSSDより遅いけど、その後の生成速度はHDD/SSDで大て変わらんって認識でいいですかね
画像保存速度はまた影響あるかもだけど
小物ファイルのストレージ読み書きくらいで生成処理自体には影響なさそうなので
当面HDD運用ときます
CrystalDiskInfo見てみたら総書込み量のグラフが指数関数みたいになってたわ…
それHDDでやったら無限に時間かかるってことじゃないのか?
3.97 GB (4,265,380,512 バイト)
https://huggingface.co/runwayml/stable-diffusion-inpainting
1111版でも利用できるようになったらい
https://github.com/AUTOMATIC1111/stable-diffusion-webui/pull/3192
例
https://i.imgur.com/xReOpg0.jpg
https://i.imgur.com/j1JtUqb.jpg
https://i.imgur.com/KyEHyWj.jpg
多分そうだと思う
全身絵をステップ数少なめで学習させたモデルと、顔アップでステップ数多めで学習させたモデルの2つ用意て
全身学習モデルで生成→顔学習モデルで生成た画像の顔部分をインペイントで修正
ってやったらうまくいった
40万+電源+冷却+専用電線はちょっと
>>184に
ふぁって?なった
打ち上げ花火みたいになってるなw
15万位だな
画力高い人が有利なのに変わりないな
学習画像30枚くらい学習率0.000005で数万ステップやってるけど
過学習というか壊れてきてる感じがない
別によくなるわけでもなく、このままずっとこんな感じなのかな
学習途中のプレビューでは大丈夫だけど、実際に適用てprompt打ち込むと壊れてるケースがある
hypernetworkも中々難いな
きっと画風ってめちゃくちゃ繊細なんだろうね
なんかまた機能増えたの?
参加するのにVRAM18GB必要みたいだからハードルが高いが…
まじか
いろんなモデル出てきそうで楽み
はやくstable diffusion Web uiにも実装されてほい
novelAIのネガティブプロンプトが入ってた 取ったら同シードで白人になったわ
謎
かなり前にDALLEがやって批判されてたのに
https://www.techno-edge.net/article/2022/07/28/129.html
3ヶ月ぐらい前の話題だこれ
https://i.imgur.com/uvGmGDS.jpg
a high school girl
Negative prompt: lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry
Steps: 23, Sampler: Euler a, CFG scale: 12.5, Seed: 2924474267, Size: 512×512, Model hash: a9263745, ENSD: 31337
https://i.imgur.com/qWwepdO.jpeg
a high school girl
Steps: 23, Sampler: Euler a, CFG scale: 12.5, Seed: 2924474267, Size: 512×512, Model hash: a9263745, ENSD: 31337
女子高生は白い歯出て笑うという学習があり、
黒人の方が白い歯出て笑うのが歪み少ないようにAIが判断ているのかな
これもう健全な肉体持つのは黒人ですわー宣言で草
https://i.imgur.com/VW7kM74.jpeg
https://imgur.com/a/2QNYyyC
なんでいままで気づかなかったレベルでNAIとSDユーザー被ってないんやな
これが「企業にAIのプログラムを独占されてはいけない理由」なんだよ
モデル事務所に頼む時も人種指定なきゃ余り物バンバン押付けられるぞ☺
確かに学習率を下げることはできたけど学習stepを厳選た時より別に生成画像が改善ているわけではなかった。
https://wandb.ai/psuraj/dreambooth/reports/Dreambooth-training-analysis–VmlldzoyNzk0NDc3
効果あった人います?
AIはもっと融通が利かない
AIが読み取りやすいノイズやごみの少ないデータと、再利用されやすいバリエーションで再現率上げるデータがあるのが前提だもんな
人間の目でいえば曇りガラスや霧の向こうより、ントラスト高めの高精細な真夏の屋外みたいな写真や安定たアウトラインのあるアニメ調の方が認識やすい
そこへ背景なのかキャラクタの顔なのか服装なのかエフェクト的なものを含めた画風なのかすべて用意するデータも傾向も違う
大雑把に言えば全身入れれば顔がつぶれる、気を利かせた同色の背景に馴染んでるスュームは見分けがつかないそんなとを気にすると安定やすくなるよ
まぁ回数こなて癖を知るかない
黎明期ゆえに海外でも手探り状態で正解がわからない…
かファインューニングは面白い…
自分の絵を喰わせまくったら完全にピーてくれた
どうにかて金に出来ないか
自分が普段から依頼受けてるならその手順をAIで加速すればいいだけでょ
絵師がツールとて使って、修正もちゃんとてるなら何の問題もない
絵だけ用意また、でお金稼ぐのはさすがに難い
その絵でゲームなりマンガなりンテンツを自分で作るかないな
その学習工程をドキュメント化てBrainで売るとか?
AI絵師は元々の価格帯なんてゼロだから損ないけど
high school girl, kawaiiって感じにたらNAIネガで黒人出てこない
4chanのプロンプトのネガにAsianって入ってたりする
逆にベースとては人類って入れたら全人種出る、で別にいいんじゃね
正直、SDでも学習の幅は全然足らんからな
「samurai」とか入れても、中華映画に出てくる中華鎧みたいなのばっか書いてくる
まだまだAIの知識はまだら模様で、割と当たり前の部分でも結構抜けがある感じ
タイ、ベトナム、中国 日本、タヒとかでも結構違ってて正確だなと思った(自分の感覚ではね)
○○人って入れたほうがいいと思うけどね
競技プログラミングみたいだな
https://colab.research.google.com/drive/10HV7FdKm9js9YXuF_XSun_bx59xp6ywj?usp=sharing
どうせすぐにこんな絵のプロンプトくれくれスレになるw
プロンプトってそこまで重要じゃない気もする
かなりの割合でTIぐらいはやってるだろうな
なんか素材集めたりパラネーターの数字いじったり、最初の頃に思ってるのとはだいぶ違うAI画像ライフになってる
効率を求めた結果、言語化が面倒になった
1枚0.005ETHのAI絵が即売れたらい
別にAI絵でなくてもピペ使いまわ丸出の差分絵がジェネレーティブNFTとて高額取引される世界だ
NFT絵はアムウェイの洗剤とかと同じ輪を広げて金を巻き上げる道具にか過ぎない
流石に詳細明かせよ
なんでそんなことをするのかわからん
小さいの上げてるから大きくてやるよってこと?
ネットリテラシー以前の問題とてやる意味が分からない
唐突にリサイズされて送られてもだから何??って状態
俺だったら即ブロックで終わり
アリとかナシとか以前に意味不明で気持ち悪い
なんちゅうかホラーの域だわ
それはネットリテラシー以前の問題だと思う
はい、あんたより高画質で上手な画像一分も掛からず作れちゃいまた。
無駄な努力お疲れ
って言いたいなら送れば
どうせ今は1ETH10万とかだろ?詳細あっても●情報でかない
https://mevius.5ch.net/test/read.cgi/cg/1666375017/
ナラとスキマは最低価格が高すぎてAI絵は売れる気がない
詰んでる
打率が100分の1になるようなイメージ。縦なら上の人が言う通りdakimakura of xxでまあまあ上手くいくけど
AIは見たことない絵は描けない







