2022年半ばから一気に注目を集めるようになった画像生成AI。まずは、ブームとなるまでの流れを確認したい。そもそも、これほどまでに注目を浴びるようになったのは、プログラミングの知識も必要なく、テキストで内容を指定するだけで、非常に高いクオリティの画像を生成できるようになった点だ。その源流となったのが米AI研究組織OpenAIが2021年1月にDALL・E(ダリ)、2022年4月にDALL・E2(ダリ・ツー)を発表したあたりである。この時点では、悪用の可能性を恐れて一部のユーザーに向けたβ版のみの提供に留めたため、ブームにはならなかった。
だが、2022年7月にMidjourneyのβ版が登場し、8月にはStability AIがStable Diffusionをリリースして、画像生成AIが一気に注目を集めるようになる。その理由は、一般ユーザーが自由に使えるようになり、普段使用する自然言語で画像を生成できるようになったからだ。
さらに、Stability AIはソフトウェアの設計図にあたるソースコード、そしてAIが画像を学習するときに使うデータセットを全て公開し、他社がStable Diffusionをベースにして独自の画像生成AIサービスを作ることも許容している。こうして誰もが手軽に利用・開発できるツールになったことから、画像生成AIは盛り上がりを見せるようになった。
現在の画像生成AIのメインプレイヤーはいずれも「拡散モデル(ディフュージョンモデル)」と呼ばれるAIのモデルをベースにしている。このモデルは「ディフュージョン」と「クリップ」という重要な2つの技術で成り立っている。
3,400冊以上の要約が楽しめる