はじめに
2023/6/21 (水) 正午に、 Diffusion Bee のバージョン 2 が配信されました! 私は公式 discord に参加していたので、βテストバージョンを触っていたので、色々知っていたのですが、ベータ版から改良されているようです。 それについて、まとめます。
ポイント
DiffusionBee を利用することで、環境構築一切不要で、 少し手間はかかるが、LoRA を使えるようになった!!! また、ControlNet や inpainting、outpainting が実装されたことによって、ポーズを指定できるようになったり、画像の細かい修正・変更が可能になった! 画像生成の自由度が超大幅に向上した!!
バージョン 2.2.0
概要
discord の公式発表を和訳し、私の感想や解釈を加えますと、 新機能としては、
- 完全に新しいUI
- UI がかなり親切になりました!
- 複数枚を連続して生成可能に
- Automatic1111 では batch size に該当する概念だと思います。
- ビデオツール - 補間、デフォーム
- これは使い方がわからないです。というかどこで使えるのかも汗
- 新しいAIキャンバス&描画
- inpainting や outpainting の機能が向上したようです。
- ControlNet の機能が実装されたようです。
- LoRa の実装
- 後述しますが、まあ喜べる内容!!!
- 他にも諸機能の追加・改善
このような素晴らしい大型アップデートが到来しました。 これは喜ばしいことです本当に!!
入手先
入手は以下のリンクから利用できます。 M1 でも M2 でもないよって方は Intel のはずですので、二個目のリンクを踏んでください。
- M1 / M2 の方: https://github.com/divamgupta/diffusionbee-stable-diffusion-ui/releases/download/2.2.0/DiffusionBee_MPS_arm64-2.2.0.dmg
- MacOS Intel の方: https://github.com/divamgupta/diffusionbee-stable-diffusion-ui/releases/download/2.2.0/DiffusionBee_MPS_Intel-2.2.0.dmg
LoRa が DiffusionBee で使えるようになった!!
祝🎉 LoRa が使えるようになりました!! しかし、まだ心の底から喜ぶことはできません。なぜなら、 「LoRa を使うには既存のモデルとのマージが必要となっている」からです。 要は、 Chilloutmix に LoRa ファイルを使いたい時、 LoRa ファイルをわざわざマージして新しいモデルファイル(2 ~ 5 GB)を作成し、それを利用して画像生成を行う必要があります。 これのデメリットとしては、
- LoRa の重みを変更するたびにマージしなければならない
- その度に 2 ~5 GB の大きなファイルが生成されてしまう。
- ファイル名の付け方も工夫しないと、混乱してしまうかもしれない。
- LoRA を複数同時に掛け合わすことが面倒。
- 複数 LoRA を同時に利用したいときは、一つずつマージする必要がありそう。三つの LoRA を使いたいなら、三回マージするということ。結構面倒だと思う。
- マージの仕組みを理解するのが面倒。
このようなことが挙げられます。 とは言いつつも、神 developer ぽいので、すぐに LoRA もマージする必要なく使えるようになると思いますね、絶対。
今後の予想
公式の発表
公式の発表によれば、アプリにも描いているように training が可能になるっぽい!!!これは神すぎる! 要は、Local で、かつ環境構築不要で、LoRA 学習ができるということ。 Colab にお金をかけなくても良くなるかもしれませんね。
しかし、colab の良質な GPU をガンガン使わないと良い学習はできなさそうなので、そもそもの PC のスペック的に LoRA 学習は満足にできないかもしれないです。 そうはいっても、環境構築不要で学習までできるというのは嬉しすぎますね。
私の予想、今後の展開
私の予想に過ぎないのですが、
2023 年の冬くらいには、 * LoRA をマージせずに使えるようになる * 一部の Automatic1111 の拡張機能を使えるようになる。 * Dynamic のやつとか("or" プロンプト) * 棒人間のポーズをいじるエディターとか * LoRA 学習の実装
等が完了するのではないかと思っています!!!
最後に
DiffusionBee の開発速度すごい。 ノーコード&ノー環境構築で、一般人が生成 AI を使えるようになる、そういった時代を推し進めているのは間違いなく DiffusionBee だと思います。 (クラウドで動くものもあるし、賛否両論だと思いますが。)
Discord の会話も楽しそうなので、いい雰囲気で開発が進んでいれば嬉しいですね。 どうしてもエンジニア目線で考えちゃうのは悔しいですが、応援するしかないですこれは。
DiffusionBee でできることや、LoRA の使い方とか LoRA でできることについては、以下の記事を見てください!!
関連記事
ut-bioinformatic.hatenablog.jp
ut-bioinformatic.hatenablog.jp
ut-bioinformatic.hatenablog.jp
ut-bioinformatic.hatenablog.jp