東大 生物情報学科、学部生の備忘録

東京大学の学生です。日々の気づき、学び、つまづいたことをメモにします。

MENU

Diffusion Bee 最新版! LoRA 使えるようになりました!

はじめに

2023/6/21 (水) 正午に、 Diffusion Bee のバージョン 2 が配信されました! 私は公式 discord に参加していたので、βテストバージョンを触っていたので、色々知っていたのですが、ベータ版から改良されているようです。 それについて、まとめます。

DiffusionBee Version2.2.0

ポイント

DiffusionBee を利用することで、環境構築一切不要で、 少し手間はかかるが、LoRA を使えるようになった!!! また、ControlNet や inpainting、outpainting が実装されたことによって、ポーズを指定できるようになったり、画像の細かい修正・変更が可能になった! 画像生成の自由度が超大幅に向上した!!

バージョン 2.2.0

概要

公式 discord の様子

discord の公式発表を和訳し、私の感想や解釈を加えますと、 新機能としては、

  • 完全に新しいUI
    • UI がかなり親切になりました!
  • 複数枚を連続して生成可能に
  • Automatic1111 では batch size に該当する概念だと思います。
  • ビデオツール - 補間、デフォーム
    • これは使い方がわからないです。というかどこで使えるのかも汗
  • 新しいAIキャンバス&描画
    • inpainting や outpainting の機能が向上したようです。
    • ControlNet の機能が実装されたようです。
  • LoRa の実装
    • 後述しますが、まあ喜べる内容!!!
  • 他にも諸機能の追加・改善

このような素晴らしい大型アップデートが到来しました。 これは喜ばしいことです本当に!!

入手先

入手は以下のリンクから利用できます。 M1 でも M2 でもないよって方は Intel のはずですので、二個目のリンクを踏んでください。

LoRa が DiffusionBee で使えるようになった!!

祝🎉 LoRa が使えるようになりました!! しかし、まだ心の底から喜ぶことはできません。なぜなら、 「LoRa を使うには既存のモデルとのマージが必要となっている」からです。 要は、 Chilloutmix に LoRa ファイルを使いたい時、 LoRa ファイルをわざわざマージして新しいモデルファイル(2 ~ 5 GB)を作成し、それを利用して画像生成を行う必要があります。 これのデメリットとしては、

  • LoRa の重みを変更するたびにマージしなければならない
    • その度に 2 ~5 GB の大きなファイルが生成されてしまう。
    • ファイル名の付け方も工夫しないと、混乱してしまうかもしれない。
  • LoRA を複数同時に掛け合わすことが面倒。
    • 複数 LoRA を同時に利用したいときは、一つずつマージする必要がありそう。三つの LoRA を使いたいなら、三回マージするということ。結構面倒だと思う。
  • マージの仕組みを理解するのが面倒。

このようなことが挙げられます。 とは言いつつも、神 developer ぽいので、すぐに LoRA もマージする必要なく使えるようになると思いますね、絶対。

今後の予想

公式の発表

公式の発表によれば、アプリにも描いているように training が可能になるっぽい!!!これは神すぎる! 要は、Local で、かつ環境構築不要で、LoRA 学習ができるということ。 Colab にお金をかけなくても良くなるかもしれませんね。

しかし、colab の良質な GPU をガンガン使わないと良い学習はできなさそうなので、そもそもの PC のスペック的に LoRA 学習は満足にできないかもしれないです。 そうはいっても、環境構築不要で学習までできるというのは嬉しすぎますね。

私の予想、今後の展開

私の予想に過ぎないのですが、

2023 年の冬くらいには、 * LoRA をマージせずに使えるようになる * 一部の Automatic1111 の拡張機能を使えるようになる。 * Dynamic のやつとか("or" プロンプト) * 棒人間のポーズをいじるエディターとか * LoRA 学習の実装

等が完了するのではないかと思っています!!!

最後に

DiffusionBee の開発速度すごい。 ノーコード&ノー環境構築で、一般人が生成 AI を使えるようになる、そういった時代を推し進めているのは間違いなく DiffusionBee だと思います。 (クラウドで動くものもあるし、賛否両論だと思いますが。)

Discord の会話も楽しそうなので、いい雰囲気で開発が進んでいれば嬉しいですね。 どうしてもエンジニア目線で考えちゃうのは悔しいですが、応援するしかないですこれは。

DiffusionBee でできることや、LoRA の使い方とか LoRA でできることについては、以下の記事を見てください!!

関連記事

ut-bioinformatic.hatenablog.jp

ut-bioinformatic.hatenablog.jp

ut-bioinformatic.hatenablog.jp

ut-bioinformatic.hatenablog.jp

ut-bioinformatic.hatenablog.jp

ut-bioinformatic.hatenablog.jp