※本ページは、アフィリエイト広告を利用しています。 「はじめてでもここまでできる」の本書タイトル通り、読んで3時間ほどでStable Diffusionの画像生成を思い通りにできるようになりました! Stable Diffusionでどんなことができるのかは知っていましたが、実際に自分のPCにセットアップし、プロンプトによる画像生成をはじめ、色塗り指定や画風指定、キャラをAIに学習させての画像生成までできました。Stable Diffusion初心者の人にお勧めの解説書を紹介します。 また、少しやってみたけどTextual InversionやControlNetやLoRAなどがうまく使えない、そんな人にもかなりお勧めです。 本書は「はじめてでもここまでできる」というタイトル通り、初心者向けの解説書です。そして「本格活用」とあるように、ただ使えるようになるだけでなく、塗りの書き込み感、色塗
はじめにこの記事は、初めてStable DiffusionのLoRAを作成する方に向けた解説です。わかりづらかったらすみません。 この解説ではSDXLベースのAnimagine-XL-3.1で二次元イラストのキャラクターのLoRAを作成します。 注意すでにWebUIの環境構築と生成ができていて生成に慣れている前提のガイドとなります。 Windows向けのガイドです。 また、NVIDIAのGeForce RTXグラフィックボードが搭載された高性能なパソコンが必要です。 そもそもLoRAってなんぞや?Low-Rank Adaptationが正式名称です。 難しくいうと、ウェイトとデータセットの差分を出力するものです。低ランクの行列に分解してからファインチューンすることで少ないメモリで学習できるようにしたものです。 簡単に言えば、LoRAはキャラ、衣装、シチュエーションや画風などを追加で学習した
2023年より注目を浴び始めた生成AI。ChatGPTやMidjourneyによる生成AI技術が話題となりました。 なかでも近年技術が飛躍的に伸びているのがAI画像生成です。AI画像生成は日常の話題になるようなバラエティに富んだ画像を作成できるだけでなく、営業資料やPR動画の素材といったビジネスの面で役に立つ生成も可能になりつつあります。 実際に営業資料や提案資料に生成AIを活用している企業もあり、AI画像生成を駆使することでノンコア業務の削減できたり、魅力的な資料を一瞬で作ることもできます。 そこで本記事では、AI画像生成を無料でつくれるサイト5選や、目的の画像を一発で抽出するコツ、利用時の注意点について解説します。
量子科学技術研究開発機構(QST)などの研究チームは30日、生成AI(人工知能)を活用して、頭の中で思い描いた画像をある程度まで復元することに世界で初めて成功したと発表した。成果は同日付の国際専門誌「ニューラルネットワークス」に掲載された。 【写真で比較】復元する前と後のボウリングの球 脳の活動から画像を復元する研究はこれまでもあった。しかし従来は、実際に画像を見ている時の脳活動からの復元や、顔や文字、簡単な図形など種類を特定した上での復元に限られていた。今回の成果は、風景や複雑な図形など思い浮かべたあらゆる画像の復元が可能という。 研究チームはまず、被験者に1200枚のさまざまな画像を見せ、機能的磁気共鳴画像化装置(fMRI)で各画像を見ている際の脳活動を記録した。一方で、AIにもこれらの画像を認識させ、色や形、質感など約613万の指標からなる「採点表」を作成。脳活動の記録と採点表を照合
注意・キャラクターの絵が描きたい人のための記事 ・三ヶ月上達法をベースにしてます。イラストレーターのさいとうなおきさんが紹介しているものなので詳しくはこちら ・この記事でいう「絵が上手くなる」という言葉は、デッサン崩れがなくなったり、線が上手く描けるという意味 ・線画が上手くなるまでの話が中心なので、塗りの話ではない この記事の目的参考にしている絵描きさんの線、絵柄に近づけるようになる。 最初に話しておきたいことここは大人になってからキャラクター絵を描けたらいいな、って人のための記事です。というのも自分自身二十歳を越えてからキャラ絵を描き始めたからです。 ここ数年youtubeでのイラスト講座が増えてきて、それに色々自分の考えを混ぜ込みながら考えた説をこの記事で書いていきます。 三ヵ月上達法、これは他のイラストレーターもオススメと言っているようにかなり効率的だと思いますのでこれをしていくた
2022年8月に公開された画像生成AI「Stable Diffusion」は、世界中のユーザーによって猛烈な勢いで拡張機能やプラグインが追加されており、ユーザーインターフェース(UI)で簡単にStable Diffusionを使える「AUTOMATIC1111版Stable Diffusion web UI」なども登場しています。そんなStable Diffusionで元となる画像の構図や絵柄を維持したままイラストを描き足す「アウトペインティング」機能を用い、どんどん画像を拡張できるツール「stablediffusion-infinity」が登場しました。 GitHub - lkwq007/stablediffusion-infinity: Outpainting with Stable Diffusion on an infinite canvas https://github.com/
2022年8月に一般公開された画像生成AIの「Stable Diffusion」はNVIDIA製GPUで計算を行うように設計されており、求められるマシンスペックも高いため、ローカル環境で行うには少し敷居が高いところがあります。プログラマーのcmdr2氏が開発した「Stable Diffusion UI」は誰でも簡単にStable Diffusionをローカル環境に導入可能な上に、GPUの代わりにCPUを使って処理を行うことができるので、高性能なGPUを積んでいないマシンでも画像を生成することが可能です。 GitHub - cmdr2/stable-diffusion-ui: A simple 1-click way to install and use Stable Diffusion on your own computer. Provides a browser UI for gene
画像生成AI「Stable Diffusion」は、指示した通りの画像を生成してくれるAIとして大きな注目を集めています。Stable Diffusionを実際に使うにはPythonのインストールといったPCの知識が求められる作業が必要なのですが、有志が開発した「NMKD Stable Diffusion GUI」なら誰でも簡単にStable Diffusionを使う環境を整えられます。そんなNMKD Stable Diffusion GUIではStable Diffusionに備わった各種機能を簡単操作で実行可能なので、NMKD Stable Diffusion GUIの各種設定項目や自分好みの画像を生成するまでの手順を徹底的にまとめてみました。 My easy-to-install Windows GUI for Stable Diffusion is ready for a beta
より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion] こんにちは。今回はStableDiffusionのimg2imgと昔ながらのフォトバッシュを複合することで、より思い通りに、より完璧に近い画像を仕上げる手法について紹介します。SDやimg2imgについては過去記事を参照して下さい。まずこちらをご覧下さい。 ■『昼飯を食べるバットマンとジョーカー』を作る。『昼飯を食べるバットマンとジョーカー』A film still of Batman and Joker eating lunch in the diner, worm lighting, cinematic tone. The Dark Knight(2008)なんでしょうかこの凶悪な白塗りバットマンは。『昼飯を食べるバットマンとジョーカー』を生成させると高確率でこのような画
画像生成AI「Stable Diffusion」は、「森で遊ぶクマ」「アイスクリームを食べる人間」といった文章を入力するだけで文章に沿った画像を出力してくれるAIです。そんなStable Diffusionには文章と共に「元となる画像」を入力することで出力画像の精度を向上させられるモード「img2img」が存在。このimg2imgを駆使して簡単なラフ画像から高品質なイラストを生成する手順について、ソフトウェアエンジニア兼フォトグラファーのアンディ・サレルノ氏が解説しています。 4.2 Gigabytes, or: How to Draw Anything https://andys.page/posts/how-to-draw/ Stable Diffusionに「森で遊ぶクマ」といった指示を与えた場合、「構図がイメージ通りではない」「夏の森ではなく、冬の森がいい」といったように、イメージ
一応、StableDiffusionとははっきりまず言います…とにかくやばいです。 分かりやすく、他のDALL・E2、Midjourney、Disco Diffusion、他有象無象Text to image machine learning系サービスと比較しますと… クオリティがかなり高い。 制限がなくなり、かなり細かい調整ができるようになったDALL・E2のような感じです。 生成が早い。 設定なしで使えば正直体感DALLE2より早いです。6秒..くらい? 安い。 3円くらいだと思います。 DALL・E2は1生成17円。Midjourneyは月4000円。 オープンソース これからいろんなサービスにこのAIが搭載されます。 他AIではかけられている学習データのフィルターがない。 各国の代表者や、有名人、ポルノがデータに含まれています。 PC上で使用できる。( = その場合無料) いや、こ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く