Last Updated on 2025-07-18 10:07 by admin
Stable Diffusionはオープンソースなので完全にローカルの環境に導入することができます。有料のサービスやソフトは必要なく、一度構築してしまえばオフラインの状態で無制限に画像生成することができます。今回は2つの方法での環境構築についてと、モデルやLoRAの導入方法や使い方について解説します。
Stable Diffusionとは?
「Stable Diffusion(ステーブルディフュージョン)」は、2022年8月にイギリスの企業「Stability AI(スタビリティエーアイ)」によってリリースされた、商用利用可能なオープンソースの画像生成AIです。
これは「拡散モデル」と呼ばれる機械学習アルゴリズムを基盤としています。拡散モデルとは、ランダムなノイズ画像から、大量の画像から学習したデータを元に少しずつノイズを取り除いていくことで、指示(プロンプト)に合った画像を生成する技術です。Stable Diffusionの特徴は以下の点にあります。
- オープンソース: ソースコードが公開されているため、研究者や開発者が自由に改良や拡張が可能
- 最小限のリソース: 比較的少ないコンピューティングリソースで高品質な画像生成が可能
- 多様な応用: テキストから画像生成(Text-to-Image)だけでなく、画像から画像生成(Image-to-Image)、画像修復など幅広い機能をサポート
- コミュニティによる発展: 世界中の開発者によって様々なバージョンやカスタムモデルが開発され続けている
他のAI画像生成ツール(DALL-E 、Midjourney等)と比較すると、Stable Diffusionはローカル環境で動作させることができる点が大きな特徴です。これにより、パソコンに導入さえできてしまえばインターネット接続がなくても使用でき、プライバシーを保ちながら無制限に画像生成が可能になります。
オープンソースであるため、様々な企業がStable Diffusionを利用したサービスを展開したり、個人のパソコンで自由に利用することが可能です。アーティスト、デザイナー、マーケティング担当者、そして創作を楽しみたい一般ユーザーまで、幅広い層に活用されています。
画像生成には「プロンプト」と呼ばれる、AIに対する指示文を入力する必要があります。正式な呼び名ではありませんが「呪文」と呼ばれることも多いです。
Stable Diffusionを利用するには大きく分けて3つの方法があります。
1.クラウドAPI(Dream Studio)を利用する
無料でStable Diffusionを体験できる
継続的な利用にはサブスク加入が必須
2.GPUクラウドサービス(Google Colab)を利用する
一部制約はあるが大量生成すればコスパは良い
外部の環境に依存する点が多く、設定がやや複雑
3.ローカル環境で利用する
導入さえできてしまえば無制限に使える
要求されるPCスペックや知識のハードルが高い
☆本記事で紹介☆
今回は「3.ローカル環境で利用する」方法について解説していきます。
7/11追記
Stability AIより規約更新が発表され、7/31以降、あらゆる性的コンテンツの生成が禁止となりました。詳しくは以下の記事をご確認ください。
※本記事の内容は2025年7月時点の情報です。大きな変更点は随時更新していきますが、モデルやUI、料金体系などはの詳細は必ず公式サイトや最新の情報も併せてご確認ください。
目次
はじめに
今回紹介する方法はWindows10以降向けに、Stable Diffusionの最もメジャーなUIである「Stable Diffusion Web UI by AUTOMATIC1111」(通称AUTOMATIC1111)を導入する方法になります。
オープンソースプロジェクトとしてGitHub上で開発されているStable Diffusion用のGUIの一つで、その完成度から多くの人によって利用され、様々な拡張機能などが開発されています。
「AUTOMATIC1111」はMacOSでの完全なサポートがされていないため、一部機能が利用できない可能性がありますが、その場合は「DiffusionBee」など、ほかのUIを利用する方法があります。これについては改めて解説する予定ですので、ぜひチェックしてください。
そして、ローカル環境で画像生成するためには、かなり高いパソコンのスペックが要求されます。
最低環境(ギリギリ動かせる)
OS | Windows10 64bit |
GPU | NVIDIA GeForce GTX 1060 (VRAM 6GB) |
容量 | 30GB以上の空き SSD推奨 |
CPU | Intel Core i5 第6世代 AMD Ryzen 5 1400 |
メモリ | 8GB |
推奨環境(快適に利用できる)
OS | Windows10 64bit |
GPU | NVIDIA GeForce RTX 3060 (VRAM 12GB) |
容量 | 100GB以上の空き SSD推奨 |
CPU | Intel Core i5 第10世代 AMD Ryzen 5 3600 |
メモリ | 16GB |
上の表はあくまで目安にはなりますが、画像生成するにあたって、最も重要なのは「GPU(VRAM)の容量とNVIDIAのCUDA対応か」で、次点で「SSDかどうか」です。それ以外の要素は画像生成自体にはあまり影響しませんが、並行して他のソフトやアプリを利用したりする場合や、拡張機能や追加学習を利用する場合には、より高いスペックが要求される場合もあります。
VRAMとは、いわばGPU専用のメモリであり、この容量が大きいほど、GPUが同時に処理できる情報の量が増えます。そのため、巨大なデータを扱う画像生成ではGPUの性能よりもVRAMの容量の方が重要視されるのです。
この要件を満たせない場合は、ローカル環境での利用は難しくなりますので、GPUクラウドサービスなどを活用する方法をおすすめします。
「AUTOMATIC1111」およびその他UIを導入する手順として、大きく2つの方法が存在します。
〇「Stability Matrix」をインストールし、それを経由する方法
→導入方法(Stability Matrix経由)
〇「Python」と「git」をインストールし、それを経由する方法
→導入方法(Python・git経由)
それぞれには用途によって明確なメリットとデメリットがありますので、自分がどういう風に利用したいかを正確に把握する必要があります。
結論から言えば、難しいこと抜きにとりあえず色々試してみたいなら「Stability Matrix」、拡張機能や開発、追加学習などをやり込みたいなら「Python・git」がおすすめです。
導入のまえに、NVIDIAの公式サイトから、最新のドライバーをダウンロードしておきましょう。
自身のGPUやOSの情報はWindowsボタンから「設定」→「システム」→「バージョン情報」から確認することができます。

導入方法や特徴についてそれぞれ詳しく解説していきます。
導入方法(Stability Matrix経由)
「Stability Matrix」は、オープンソースプロジェクトとしてGitHub上で開発されており、主に「LykosAI」という開発者によって管理・更新されています。プロジェクトはMITライセンスのもとで公開されており、誰でも自由に利用・改変が可能です。
Pythonやgitが内包されており、これ一つでAUTOMATIC1111をはじめとした各種UIや、モデルデータのダウンロード、主要な拡張機能の導入などを一括で管理することができます。
その分、深い拡張性などは「Python・git」に劣る面もありますが、独自で組んだスクリプトを使いたいなど、よっぽど深く触らない限りは「Stability Matrix」で不足になることはないでしょう。
まずはGitHubの「Stability Matrix」のページにアクセスしましょう。
Stability Matrix | GitHub(外部サイト)
画面を少し下にスクロールすると、OSごとのダウンロードボタンがありますので、あてはまるものをクリックして、ファイルをダウンロードします。
今回はWindows前提で解説します。

そうしたらダウンロードした圧縮ファイルを任意の場所(SSDストレージ内推奨)に、今回は説明のためCドライブ上に展開していきます。中には”Stability Matrix”というファイルがありますので、ダブルクリックで起動させます。

警告が出ることがありますが、「詳細情報」をクリックして、実行します。


そうすると最初の設定画面が出てきます。パソコンに搭載されているGPUが表示されますので、確認の上、使用許諾契約書に同意するチェックをつけて次に行きます。

次に、各種データの格納場所を指定できます。まとまった空き容量が確保できているなら「Portableモード」を選択することをおすすめします。

そうすると、データ収集を許可するかどうかを確認されます。これも「プライバシーポリシー」を確認の上、好きな方を選択してください。

そしてインストールするUIを選択します。ここでは「Stable Diffusion Web UI by AUTOMATIC1111」をインストールします。少し下にスクロールすると出てきます。
リストが表示されない場合は「Show All Packages」のチェックをオンにしてください。

そうすると「Visual Studio」がデバイスに変更を加えることを許可するかどうかのポップが出てくることがあるので、これも許可します。
インストールが開始されると、この時点でモデルデータのダウンロードをおすすめされます。詳細が見れないので、とりあえずここではダウンロードせずに閉じます。

しかし、モデルの名前で検索し、「Civitai」(後述)でそのダウンロードページなどを確認して、推奨設定やライセンスを確認できるならば、先にダウンロードしても問題ありません。
閉じるとフォルダ名の変更点のお知らせがでてきますので、OKで閉じます。

インストールがこの時点で終わってなければ、ダイアログが表示されていますので、終わるまで気長に待ちましょう。インストールの時間はパソコンのスペックによって前後しますが、数分~数十分かかります。

終わるとパッケージ一覧に追加されます

「Launch」をクリックして起動します。
しばらく待つと、ブラウザ(Microsoft EdgeやGoogle Chrome)が自動で起動し、「AUTOMATIC1111」が表示されます。

以降、起動するには「Stability Matrix」を起動し、パッケージから一覧から「Launch」を押すだけです。もし見当たらなければ画面左上のハンバーガーメニューを押して、「パッケージ」を選択してください。

導入は以上になります。→利用方法の見出しまでスキップする
導入方法(Python・git経由)
まずは「Python」と「git」をインストールしましょう。
これに限らずですが、何かをインストールするときは「どこにインストールしたか」を必ず把握して、可能であればメモに残すなどしましょう。後から問題が発生してうまく動作しなくなった時、どこにインストールされているかがわからないままでは解決しようがなくなってしまうためです。複数のソフトを使用したり、Stable Diffusionのようにオープンソースで無料公開されているものはカスタマイズ性の高さ故にトラブルの原因が多く、調べたり人に聞いたりしても解決できない可能性が非常に高くなります。
Pythonは最新版ではなくver.3.10.6が推奨されています。すでに違うバージョンがインストールされている場合は、不要ならアンインストールしたり、仮想環境を構築してバッティングしないようにする必要があります。その方法は後述します。
Python 3.10.6 ダウンロード | Python公式サイト(外部)
ページ下部にインストーラーのダウンロードリンクがありますので、自分のOSに合わせてダウンロードしてください。
今回はWindows前提で解説します。

ダウンロードしたファイルを開きます。「Add Python 3.10 to PATH」のチェックを入れて上の「Install Now」を選択しましょう。
既に別バージョンのPythonがインストールされていて、別途仮想環境を構築したい場合はチェックを入れないでください。

インストール自体はすぐに終わります。

そのまま閉じてください。
PATHが正しく設定されているかの確認方法
Windowsボタンから「設定」→「システム」→「バージョン情報」→「システムの詳細設定」→「環境変数」から「Path」という項目でインストールしたPythonの場所が指定されていれば成功です。
もしこれが表示されていない場合は、「新規」で変数名を「Path」、変数値にPythonがインストールされている場所(デフォルトの設定ではC:\users\ユーザー名\AppData\Local\Programs\Python\Python310\)を指定しましょう。
次は「git」をインストールします。こちらは最新バージョンで問題ありません。記事公開時点では2.49.0が最新となっています。


ダウンロードしたファイルを開きます。いろいろ聞かれますが、すべてそのまま次に進んで問題ありません。















最後の画面が出たらそのまま「Finish」で閉じてください。デフォルトだとリリースノートがブラウザで開きますが、これもそのまま閉じてください。
次は「AUTOMATIC1111」のインストールをします。
まずは好きな場所にインストールするためのフォルダを作成します。(SSDストレージ内推奨)今回はCドライブ上に”Stable Diffusion”という名前でフォルダを作成したという前提で説明します。
“Stable Diffusion”フォルダの中にインストールするのですが、3つの方法があります。どれでもやることは変わらないので、好きな方法を選択してください。
・Git Bashを使う
フォルダー内で右クリックして「Open Git Bash Here」を選択する。(Windows11の場合は「その他のオプションを確認」内に隠れている可能性があります。)

・Windows PowerShellを使う
フォルダー内で右クリックして「ターミナルで開く」を選択する。

・コマンドプロンプトを使う
Windowsの検索窓に”cmd”と入力する。黒い画面が出てきたら”cd C:\Stable Diffusion”と入力してEnterを押す。

準備が整ったら以下のコードを張り付けてEnterで実行します。
まずはPythonとgitがちゃんとインストールされているかを確認します。
python –version
これで”Python 3.10.6″と出れば問題ありません。もし”Python”とだけ表示される場合は、インストールがうまくできていないか、Pathの設定ができていない可能性があります。
git –version
こちらもgitのバージョンが表示されれば大丈夫です。
そうしたらインストール用のコードを実行しましょう。
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
Pythonの仮想環境を構築する場合はここで手順が追加されます。
以下のコードを続けて実行してください。
C:\Users\ユーザー名\AppData\Local\Programs\Python\Python310 -m venv C:\Stable Diffusion\venv
そして”stable-diffusion-webui”内の”webui-user.bat”を右クリックして「メモ帳で編集」を選択し、内容を以下のものに置き換えて上書き保存してください。
@echo off
set PYTHON=
set GIT=
set VENV_DIR=C:\Stable Diffusion\venv
set COMMANDLINE_ARGS=
call %VENV_DIR%\Scripts\activate
call webui.bat
以上で仮想環境の構築は完了になります。以降は通常の手順でインストールを進めてください。
実行すると数秒で”stable-diffusion-webui”というフォルダが追加されますので、中にある「webui.bat」を起動します。(.batが省略されて表示されている場合があります。その場合はマウスカーソルを合わせて数秒待つと、ファイルの種類が表示されますので、「Windowsバッチファイル」であることを確認してください。)

すると黒い画面上でインストールの進捗が表示されます。完了までの時間はパソコンのスペックによって前後しますが、数分~数十分かかりますので気長に待ちましょう。

しばらく待つと、ブラウザ(Microsoft EdgeやGoogle Chrome)が自動で起動し、「AUTOMATIC1111」が表示されます。

以降、起動するには「webui.bat」をダブルクリックするだけです。
利用方法・モデル、LoRA導入方法
プロンプトの入力例やAUTOMATIC1111の使い方に関しては過去の記事で解説していますので、そちらも併せてご確認ください。
今回は「モデルとLoRAの使い方」について解説します。
モデル(Checkpoint)とは、大量の画像を学習して作成される大容量のデータファイルです。画像生成AIの最も重要な部分であり、この学習元の内容によって、出力結果が大きく左右されます。
例えば、アニメ風イラストだけを学習させればアニメ風を出力するのが得意になりますが、実写系は学習していないため出力できないモデルが出来上がります。
画像を生成するにはこのモデルが必須となります。複数のモデルをダウンロードして、読み込むためのフォルダに入れておけば、UI側で簡単に切り替えられるので、用途や好みに合わせていくつかそろえておくことができます。
対してLoRA(Low-Rank Adaptation)は追加学習データであり、モデルよりもはるかに少ない枚数から学習できる軽量のデータファイルです。生成に必須ではありませんが、小回りが利き、元のモデルをいじらなくても、生成される画像の方向性を簡単に変えることができます。
例えば、もともとのモデルが十分に学習できていないイラストの構図や特定のシチュエーションを学習させたLoRAを使用することで、都度大容量のモデルをいくつも用意したり、長時間かけて学習させなおす必要がなくなります。
ラーメン屋で例えれば、モデルはスープや麺で、LoRAはチャーシューや煮卵などのトッピングやコショウやニンニクなどの調味料と言えるでしょう。醤油や味噌といった様々な特色があるスープのように、モデルを変えたり学習させなおすことは、また大量のダシを取るために大量の食材を用意して、長時間煮込むのに似ており、麺なども同じで完成したものを後から微調整することはできませんが、トッピングならそれほどはコストをかけずにいろいろなものを試したりスープとの相性を考えて作り直すこともできるということです。
ただ、皆さんはきっとラーメン屋は目指していないと思いますので、すでに出来上がっているスープを使ってインスタントラーメンを作ることになるでしょう。
そこで、いろんな人が作ったモデルやLoRAをダウンロードできる「Civitai」を利用します。
「Civitai」は2022年に創業された、アメリカ・アイダホ州を本拠地とするStable Diffusionの大手コミュニティサイトです。基本すべて英語で書かれているため、翻訳機能などを活用しながら読む必要があります。
ここでは数多くのモデルやLoRAがダウンロードでき、有料で画像生成するGUIも備えています。ユーザーたちはここで生成した画像を公開したり、日々意見交換をして開発ユーザーの研究に貢献したりしています。
ダウンロードだけなら会員登録等は不要です。画面左上の「Models」をクリックします。

そうすると、いろんなモデルのサムネが並んで表示されます。サムネの左上に「Checkpoint」と書かれているのがモデルデータです。画面左上の「Filters」から「Model types」の「Checkpoint」で絞り込むこともできます。
好みのものを選んでみましょう。そうするとモデルの詳細ページに飛びます。サムネの下側にモデルの概要があり、ここに推奨設定などが書かれている場合があります。
右側上部にはダウンロードボタンがあり、下部にはライセンスの表記があります。

右下のアイコンをクリックすると詳細が出ます。さらに左側のリンクをクリックすれば、オリジナルモデルのライセンスを確認することができます。

数えきれないほどの多くのモデルがありますが、ほとんどは何かの派生形で、既存のモデル同士の掛け合わせ(マージ)によって作られています。基本的には以下のような種類に分類することができます。
・SD1.5系 Stable Diffusionの原初のモデルからの派生です。512*512の解像度で学習されており、現在では古い規格に当たりますが、逆に解像度が低いことで生成する際にGPUにかかる負担を軽減できる点と、研究が一番進んでいるため、今でも数多くのモデルが開発されています。直接大きな解像度で出力すると破綻を起こしがちですが、高解像度に変換する機能なども昨今は充実しているため、そこまでは気にならないでしょう。 |
・SD2系 上記の正統後継モデルで、768*768、1024*1024の高解像度化や様々な新機能への対応が当時は特徴的でしたが、GPUへの負荷増大、SD1.5系からの品質低下問題や、互換性の低さからそこまでユーザー間で開発が進むことはありませんでした。 |
・SDXL系 上記の正統後継モデルです。1024*1024の解像度で学習されており、従来よりも高品質な画像を生成できますが、小さい解像度で作ると破綻を起こしてしまうため、小回りが利きにくくGPUのスペックが足りない場合は扱うのが難しくなります。SD1.5系との互換性の高さと、時代とともに高性能GPUが普及してきたため、現在では最もメジャーなモデルの原型です。 |
・SD3系 Stable Diffusionの最新モデルですが、研究がまだ進められておらず、個人が扱うにはSDXLで十分なパフォーマンスを発揮できるため、公開されているモデルは増加傾向にあるものの、まだ非常に少ないです。 |
・Animagine系 SDXLの派生モデル。名前の通りアニメイラスト系に強いモデルが多く、背景や小物の出力にも長けています。現在では下記のIllustrious系に追いやられ気味ですが、オリジナルの開発は続けられており、初心者向けのモデルとして人気があります。 |
・Illustrious系 SDXLの派生形モデル。非常に汎用性が高く、アニメ系も実写系も幅広く開発されています。そのかわり背景や小物の出力はやや苦手な傾向にあります。学習データの多さゆえに生成の幅が広いというのが長所でも短所でもあるため、いろいろなユーザーが自分好みの調整を加えたモデルが多く公開されており、現在では最も人気なモデル系列と言えるでしょう。 |
・Pony系 SDXLの派生形モデル。アニメ系、実写系ともに長けており、特に2人以上を描写することが得意ですが、独自の学習データを使用しているため、かなり癖が強く、特殊なプロンプトを使用する必要があります。(後述)使いこなすことができればかなり高品質な画像を生成できるようになるため、Illustrious系と並んで人気な系列です。 Ponyの原典となるモデルが、すべてのPony系派生モデルで生成した画像の個人利用・商用利用に関わらず、公開する際にクレジット表記が必須としたライセンスとなっています。それ以外の細かなところはモデルによって異なりますので、特に注意してライセンスを確認するようにしましょう。 |
モデルは異なる2つをマージさせて、新しいモデルを比較的簡単に作ることができます。そのため、この分類も完全なものではなく、SD1.5系とIllustrious系をマージして、GPUへの負担が少ないIllustrious系モデルが存在することもありますし、AnimagineとIllustriousのいいところどりを狙ったモデルなどもあります。
LoRAも同様に「Civitai」からダウンロードすることができます。Checkpointの代わりにLoRAと表記されているものを探しましょう。こちらもフィルター機能で絞り込むことができます。
注意点としては、LoRAは学習する際に元となるモデルを設定する必要があり、それを基準に学習されているため、モデルとLoRAをIllustriousならIllustriousで、PonyならPonyでそろえる必要があります。特にPonyは他の系列で作られたLoRAとの相性が悪いことが多い反面、その他のSDXL系は互換性が比較的高いです。
いろいろな人が公開しているモデルやLoRAの中にはどうしても相性の良し悪しがありますので、同じ系列でもLoRAが効きにくいこともあれば、系列が違ってもなんとなく効いたりすることがあります。こればかりはいろいろ試すまではわかりません。
ダウンロードしたデータの置き場は、以下の通りになります。今回はCドライブの直下にインストールした前提で解説を進めていますが、もし別の場所にインストールした場合は、C:\とは限りませんので気を付けてください。
モデルデータの保存先
・Stability Matrixの場合
C:\StabilityMatrix-win-x64\Data\Models\StableDiffusion
・Python・gitの場合
C:\Stable Diffusion\stable-diffusion-webui\models\Stable-diffusion
LoRAデータの保存先
・Stability Matrixの場合
C:\StabilityMatrix-win-x64\Data\Models\Lora
・Python・gitの場合
C:\Stable Diffusion\stable-diffusion-webui\models\Lora
データを正しく置けたらAUTOMATIC1111の左上でモデルを選択するところがあるので、ここから使いたいモデルを選択します。右側の青いボタンを押すとフォルダを読み込み直すので、これを押してもリストに表示されない場合は、データの置き場所が間違っているか、違うデータを置いてしまっている可能性があります。

あるいは中央当たりのタブからLoRAと同様に選択することもできます。こちらはサムネイルも含めた表示になるので、視覚的に区別がつけやすく便利です。こちらの再読み込みボタンはタブの右端にあります。

LoRAを選択すると、プロンプト入力欄に以下のようなテキストが入力されます。
<lora:“LoRAデータの名前”:1>
つまり、LoRAの指定はプロンプトと同様に行うことができます。後ろの数字はLoRAを反映させる強度を示しており、数字を下げれば影響が小さくなり、上げれば影響が大きくなります。小数点以下の単位で指定することができますが、プロンプトと同じで上げすぎると破綻を起こすようになります。推奨設定が特になければ生成しながら数字を調整していきましょう。0.6~1.8ぐらいの間で調節するのが適切です。
LoRAに関してはいちいちタブから選択しなくても、正しい場所にデータが保存されていればプロンプトとして入力するだけで適用することができます。また、複数のLoRAを同時に適用することもできます。
おまけではありますが、生成する解像度の比率にも推奨される数値があります。絶対に守らなければいけないわけではありませんが、安定した画像生成のために覚えていて損はありません。以下はSDXLを基にした多くのモデルでサポートされているアスペクト比になります。縦横は入れ替えても問題ありません。
1:1 | 1024*1024 512*512(SD1.5) |
3:2 | 768*512(SD1.5) |
9:7 | 1152*896 |
19:13 | 1216*832 |
7:4 | 1344*768 |
12:5 | 1536*640 |
最後に、Pony系独自のプロンプトについて少し解説します。
よく高品質画像を生成するためのテンプレートとして指定される”master piece, best quality, high quality”などではなく、”score”というプロンプトを使用します。
これは学習元の画像にそういうタグ付けがされていることに由来しており、画像のクオリティを4~9で独自に採点しているためです。”score_9″が最高得点で、”score_7_up”は7点以上を指すプロンプトになります。
プロンプト
score_9, score_8_up, score_7_up
ネガティブプロンプト
score_6, score_5, score_4
これがPony系を使うときのテンプレートになります。
もちろん”master piece”が含まれていても大きな問題はありませんが、余計なプロンプトは他のプロンプトの効き方に影響する可能性があるので、極力消してしまいましょう。
モデルとLoRAの導入方法、使い方の解説は以上になります。
よくある症状と対処方法
よくある症状 | まず試してみること |
---|---|
【画像生成関連】 | |
「CUDA out of memory」というエラーが表示される | 生成する画像のサイズを小さくする(例: 512×512)。 Bach sizeを「1」にする。 |
動作が極端に遅い、または起動に失敗する | NVIDIA公式サイトから最新のGPUドライバをインストールする。 他に起動しているアプリケーションを終了する。 |
【Python関連】 | |
「’python’ は、内部コマンドまたは外部コマンドとして認識されていません」と出る | Pythonインストール時に「Add Python 3.10 to PATH」にチェックを入れたか確認する。 チェックし忘れた場合は、Pythonを再インストールするか、手動でPathを設定する。 |
ライブラリのインストールに関するエラーが出る (例:ERROR: Failed building wheel for [ライブラリ名]) | コマンドプロンプトで python -m pip install --upgrade pip を実行してpipを更新後、再度 webui-user.bat を起動してみる。 |
【git関連】 | |
「’git’ は、内部コマンドまたは外部コマンドとして認識されていません」と出る | gitが正しくインストールされているか確認する。 インストール時のPath設定が適切に行われたか確認する。 |
git clone コマンド実行時に失敗する | インターネット接続が安定しているか確認する。 クローンする際のURLが正しいか確認する。 |
【Web UI関連】 | |
webui-user.bat 実行後、エラーメッセージが出て止まる | ”stable-diffusion-webui ”フォルダ内の ”venv ” フォルダを一度削除し、再度 webui-user.bat を実行して仮想環境を再構築してみる。 |
ブラウザでWeb UIが開かない | ファイアウォールやセキュリティソフトが通信をブロックしていないか確認する。 |
ダウンロードしたモデルやLoRAがWeb UIのリストに表示されない | モデルファイル やLoRAファイルが、指定された正しいフォルダに置かれているか確認する。 Web UI上の更新ボタンを押してリストを再読み込みする。 |
【その他】 | |
何をしても改善しない | パソコンを再起動してみる。 AUTOMATIC1111の関連フォルダをバックアップの上、一度削除し、最初からインストール手順をやり直してみる。 |
上記で解決しない場合は、複雑な問題が絡み合っている可能性があります。該当のソフトを一度すべてアンインストールして、インストールしなおしてみましょう。
それでも解決しない場合は、すでにパソコンにインストールされている他のソフトや、ウイルス対策ソフトなどが競合を起こしてしまっている可能性があります。
そういったパソコンの環境については個々で違うため、一概に「こうすれば直る!」といった方法を提示することができないため、専門的な知識を持った人に相談したり、考えうる問題を一つずつ検証していく必要があります。
最後に
今回は「Stable Diffusion Web UI by AUTOMATIC1111」をローカル環境で利用するための手順を紹介してきました。
「AUTOMATIC1111」は最もメジャーなUIであるため、拡張機能も豊富に開発されています。使いこなせればより快適に、より高品質な画像を生成することができます。
「Stability Matrix」ではほかのUIをインストールするのも簡単にできるため、使い比べることもできます。大まかな機能は変わりませんが、GPUへの負担を軽減することを目的に開発されているものなどもあります。
我々は今後も安心して利用できるサービスについて紹介していきます。
Stable Diffusion(AUTOMATIC1111)で生成した画像は多くの場合商用利用が可能ですが、AIによる画像生成は意図せず第三者の著作権・肖像権・商標権などを侵害するリスクもあります。また、モデルデータや追加学習データによっては商用利用を禁止していたり、商用利用以外でも公開の際にクレジット表記が求められる場合もありますので、公開・商用利用の際は、各モデルの利用規約や関連する法律を必ず確認してください。