2023/01 に Google が発表した音楽生成 AI の MusicLM について、紹介する。
beta ver のテストが、順番待ち形式で利用可能になっており、自分の番が来たのでそれを使ってみた感想を伝える。
MusicLM の概要
簡単に言うと、
Stable Diffusion の音楽生成 version
である。
本ブログでも触れてきたように、大量の学習データを利用する生成 AI は、その生成コンテンツの著作権上の問題を無視できない。
Stable Diffusion の問題を理解しているので、開発元である Google は学習済みモデルの公開を先送りにしている。
フレームワークの公開は問題なく、github に実装したコードがおそらく Google 外の人が公開している。十分に大きな学習データがあれば、高い精度で音楽を生成してくれるだろう。
SD では、学習済みデータを公開し、コードを local で扱えるようにしてしまっていたことや、LoRA で追加学習が容易になってしまい、著作権の侵害が著しかった。そのことを考慮すると、天下 Google 様が著作権侵害のリスクをとってまでモデルの公開をするとは到底思えない。
最近、とても流行っている AI イラストについて、話したい。
Stable Diffusion を使う場合、機材さえ持っておけば、一定クオリティのイラストを高確率で生成できてしまう。したがって、AI-made コンテンツがネットに溢れかえってしまっている。
実際に、7月前半にて AI イラストを一部で禁止する発表を行う前の pixiv は信じられないくらい AI イラストで飽和していた。
そして、高評価を得ている AI イラストは大体、版権キャラの二次創作である。僕目線、彼らは絶対に civitai に落ちているキャラ LoRA を使い回しているだけだ。
盗んだもので金稼ぎを行うような AI 絵師に対して、思うことや伝えたいことをまとめてみる。また筆者自身も AI イラスト生成をじっくりやってみた経験があるので、それに基づいて述べる。
AI イラストの現実
冒頭でも触れた通り、庶民でも一定のクオリティのコンテンツを超高速で生成できるのが AI の強みである。
ここ数年の生成 AI (generative AI)の発展は、stable Diffussion に見られるように、非常に目まぐるしいものがある。
そういった生成 AI はその特性ゆえに、現代のネット社会を全く別のものに変容させてしまう可能性がある。
生成 AI はあまりに短い時間で、とてつもなく多くの高精度なコンテンツを生成することができる。それによって、人間純正のコンテンツの相対量が減る可能性がある。この記事では、そういった
生成 AI のネット社会への侵攻とそれを受けて社会がどのように変化していくかを詳細に見ていきたい。
生成 AI
生成 AI として代表される Chat GPT や Stable Diffusion を見れば、その強烈さはよくわかる。
とにかく恐怖を感じた。
今、こういった技術は AI イラストレータが中心となって利用している。
しかし、DIffusionBee をはじめとした多くの No coding アプリケーションが開発途中であることは自明であり、そういったアプリが世に出回った時、問題は深刻化するであろう。フェイク画像の作成が民主化し、インターネットはフェイクで溢れるであろう。さらに興味深いことに、裁判で利用される証拠となる写真は、フェイク画像であるかもしれないと疑わねばならない。フェイク画像を利用した裁判等が起こらないことを心の底から祈るのみである。本当に恐ろしすぎる。アリバイもクソも無くなる。