タグ

画像に関するstealthinuのブックマーク (511)

  • 新たな高みを目指して - Google

    2021年の東京オリンピックで新競技として採用された以降も、スケートボードへの関心は高まり続けています。しかし人気の一方で、男女別の競技人口には依然として偏りが見られます。また、女性のプロアスリートが企業スポンサーを得る機会も未だ限られています。 この不均衡の根の原因は、女性の能力不足ではありません。プロスケーターであるスカイ・ブラウンのようなアスリートたちは、より多くの女子がスポーツに参加するよう声を上げています。しかし、こうした努力の妨げとなっている背景には、女子は男子に比べて技術に劣るという誤解があります。 スケートボードは、優れた運動神経と予測不能な体の動き、そして独自のセンスが求められるスポーツです。スタイルは常に好みや考え方で評価される中、テクノロジーを使うことで、人間の目では測定できないパフォーマンス データを取得することができます。こうして得られたデータは、女性アスリート

    新たな高みを目指して - Google
    stealthinu
    stealthinu 2024/06/07
    ポーズ推定から自動で判定させるシステム、2022年にはGoogleのチームによって実験されてるんだな。
  • ひたすらAI絵をやってたら絵が描けるようになってた話|賢木イオ @studiomasakaki

    こんにちは、「機動戦士ガンダム 水星の魔女」が大好きなおじさんです。「水星の魔女が好きすぎて、AI絵をひたすら生成してたらいつの間にか絵が描けるようになっていた」という妙な体験をしたので、それについて記事を書いてみようと思います。具体的にどれくらい?というと、特に練習していないのにこれくらい変わっていました。 ←2023年9月 / 2024年2月→ 始めにお断りしますが、この記事は、「AI絵をやるのがお絵描き上達への近道だョ!」だとか、「お絵描きをやるにはこうしたらいいョ!」といったものではありません。「絵が描けるようになる」の定義は人によって違うでしょうが、少なくともこの程度のレベルで他人様にお絵描き指南をしようなど、完全に暴挙であることくらいは分かります。私は今の自分の絵をお世辞にも上手だとは思っていませんし、それほど絵を上手になりたいとも思っていません。 この記事は「特に絵を練習して

    ひたすらAI絵をやってたら絵が描けるようになってた話|賢木イオ @studiomasakaki
    stealthinu
    stealthinu 2024/06/05
    AI絵について批判されることが多いが、AI絵すごくやってる方が絵自体もうまくなったという話。あくまでAI生成を書くための道具として使っている。
  • Deep Paint v1.0 - GAKU氏によるGrease Pencilを活用した3Dイラスト・立体絵画制作支援ツールセットBlenderアドオンが遂にリリース!

    Blender アドオン プラグイン&アドオン-Plugin&Addon ICity 1.0 Beta - 区画設計から道路生成!プロシージャルビル生成!... 2024-05-21 テクニカルアーティストのHothifa Smair氏によるBlender用の都市生成アドオン『ICity 1.0』のベータ版がリリースされました! 続きを読む Blender アドオン プラグイン&アドオン-Plugin&Addon NijiGPen v0.9 - Grease Pencilでのグラフィックデザイ... 2024-05-20 Chaosinism氏によるGrease Pencilでのグラフィックデザインやイラスト制作を支援する機能拡張が可能な無料&オープンソースのBlenderアドオン『NijiGPen v0.9』がリリースされました! 続きを読む

    stealthinu
    stealthinu 2024/05/15
    水彩画を書くみたいにして3Dモデルを作れるツール。立体を認識する部分でdeeplearningが使われているのかな?
  • 漫画家の著作権を守るAI

    エンドルフィン株式会社(社:東京都港区、代表:張鉉洙)、株式会社SUPERNGINE(社:韓国、代表:KIM DONGJUN)は2024年3月27日、東京・永田町にて開催された一般社団法人マンガジャパン及びデジタルマンガ協会合同「早春の会」にて、ピュアモデルAIによって制作したマンガ作品を初披露いたしました。 現在、市場で出回っている生成AIの多くは他の権利者の絵柄も学習した状態であるため、安易に使用してしまうと作家来の”個性”が失われるだけでなく、著作権侵害のリスクもはらんでいます。 一方で、エンドルフィン株式会社と株式会社SUPERNGINEが提供するサービスは、契約した漫画家のデータだけを学習させる、ピュアモデルAIによるものです。 加えて、著作権者である漫画家の許可がなければ作動せず、また漫画家自身がそのすべての学習成果をコントロールできるよう、オーダーメイド型でサービスを提

    漫画家の著作権を守るAI
    stealthinu
    stealthinu 2024/04/03
    やりたいことはわかるのだけどSDベースらしいので「ピュアモデルAI」という表現だけで説明するのはどうなんだろうかと。
  • C2PA とは:最新動向と適用例

    はじめに 最近、ニュース記事などで目にすることが多くなった「C2PA」という用語、みなさんご存じでしょうか? 正式には「Coalition for Content Provenance and Authenticity」と言って、コンテンツの出所・来歴の認証に関する技術標準を策定している標準化団体の略称です ※1。日語に訳すのは少々難しいのですが、C2PA 創設メンバーの 1 社であるマイクロソフトは「コンテンツの出所と信ぴょう性に関する連合」※2、アドビは「コンテンツ来歴および信頼性のための標準化団体」※3 と表現しています。 この C2PA は、2021 年にアドビ、Arm、インテル、マイクロソフト、Truepic などが中心となって創設され、デジタルコンテンツの生成元や変更履歴を証明できるメタデータを付与することで、ディープフェイクや偽情報の拡散を防ぐ技術の規格(仕様)化を行ってい

    C2PA とは:最新動向と適用例
    stealthinu
    stealthinu 2024/03/18
    C2PAとは、画像なり動画なりの生成元のサービスやアプリを認証するしくみらしい。
  • AIイラストが理解る!StableDiffusion超入門【2024年最新版】A1111、Forge対応|賢木イオ @studiomasakaki

    AIイラストが理解る!StableDiffusion超入門【2024年最新版】A1111、Forge対応 こんにちは、2022年10月からAIイラスト技術解説記事を連載してます、賢木イオです。この記事は、これまでFANBOXで検証してきた120(約70万文字)を超える記事をもとに、2024年春現在、画像生成を今から最短距離で学ぶための必要情報をまとめたメインコンテンツです。 これから画像生成を学びたい初心者の方や、手描きイラストAI技術を取り入れてみたい方が最初に読む記事として、必要知識が網羅的に備わるよう解説しています。素敵なイラストを思い通りに生成するために覚えるべきことを紹介しつつ、つまずきやすいポイントや参照すべき過去記事、やってはいけないことなどを紹介していますので、最初にこの記事から読んでいただくとスムーズに理解できるはずです。 解説役は更木ミナちゃんです。よろしくお願い

    AIイラストが理解る!StableDiffusion超入門【2024年最新版】A1111、Forge対応|賢木イオ @studiomasakaki
    stealthinu
    stealthinu 2024/03/09
    画像生成系は最近ぜんぜん触ってないから現状を把握しておきたい。しかし書かせたいものとかないんだよな… 絵の生成に対するモチベーションが低いのがつらい。
  • GitHub - VAST-AI-Research/TripoSR

    This is the official codebase for TripoSR, a state-of-the-art open-source model for fast feedforward 3D reconstruction from a single image, collaboratively developed by Tripo AI and Stability AI. Leveraging the principles of the Large Reconstruction Model (LRM), TripoSR brings to the table key advancements that significantly boost both the speed and quality of 3D reconstruction. Our model is disti

    GitHub - VAST-AI-Research/TripoSR
    stealthinu
    stealthinu 2024/03/08
    一枚絵から3Dモデル生成。Stability AI製でオープンソース!だいぶ精度良さそう。
  • Ultimate guide to optimizing Stable Diffusion XL

    IntroductionIn this article we're going to optimize Stable Diffusion XL, both to use the least amount of memory possible and to obtain maximum performance and generate images faster. We will be able to generate images with SDXL using only 4 GB of memory, so it will be possible to use a low-end graphics card. We're going to use the diffusers library from Hugging Face since this blog is scripting/de

    Ultimate guide to optimizing Stable Diffusion XL
    stealthinu
    stealthinu 2024/02/24
    SDXLで色んな高速化手法や低メモリ手法を試したレポート。音声系でも参考になりそうな情報がありそう。
  • 日々の壁打ち:「絵描きさんの言葉」と「それ以外の人達の言葉」の意味合いの違い。特に生成AIが出力する絵に関して。|Nobuyuki Kobayashi@nyaa_toraneko

    日々の壁打ち:「絵描きさんの言葉」と「それ以外の人達の言葉」の意味合いの違い。特に生成AIが出力する絵に関して。 ChatGPTで、自分のためにMy GPTsを開発すると、とても面白い体験を味わえる。このnoteは、My GPTsとの付き合い方の記録である。 はじめに:僕のパートナーは元プロの絵描きさんです僕のパートナー、世間的に言いますと、配偶者もしくは奥様は、元プロの絵描きさんです。現在は、子どものために家庭に入ってもらっています。現役時代は、ずっと僕のパートナーとして、数々のゲームの作画監督やCG監督をやってもらっておりました。 例えば、『とらドラ・ポータブル!』や『涼宮ハルヒ』シリーズのADVゲームです。 絵描きさんのパートナーがいると、大変ありがたいことに、絵やイラストについて詳しく話を聴くことができます。しかも「パートナー」ですから、相当歯に衣着せない正直な発言も聴かせてくれま

    日々の壁打ち:「絵描きさんの言葉」と「それ以外の人達の言葉」の意味合いの違い。特に生成AIが出力する絵に関して。|Nobuyuki Kobayashi@nyaa_toraneko
    stealthinu
    stealthinu 2024/02/21
    「コピペっぽい」の意味合いが違うという非常に納得の行く説明だった。ただそれも近いうちに解決される。顔生成出来るようになった時、全身描けるようになったら教えてみたいな反応だったよね。
  • GPT-4V と Segment Anything で楽々アノテーション

    これは GO Inc. Advent Calendar 2023 の 12 日目の記事です。 私 kzykmyzw は GO 株式会社でコンピュータビジョンに関する研究開発から実装までを担当しており、記事もコンピュータビジョンに関連しますが、会社での業務とは無関係です。あまり専門的に深い話はしませんが、ある程度知識のある方を対象としていますのでコンピュータビジョンに関する一般的な用語は解説せずに使います。 はじめに 2023 年の 9 月頃に画像認識が可能な GPT-4V(ision) が ChatGPT 経由で使えるようになり、2023 年 11 月 6 日に行われた Open AI DevDay で API 経由でも使えるようになったことが発表されました。主な使い方はやはり画像を自然言語で説明させることかと思いますが、普段は物体検出やセマンティックセグメンテーション(以下セマセグ)と

    GPT-4V と Segment Anything で楽々アノテーション
    stealthinu
    stealthinu 2023/12/12
    SAMとGPT-4V使った自動アノテーション。結構な精度で出来てる。
  • これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)

    Generative AI for Kritaのライブペインティング機能を実行している画面。左が筆者が描いた落書き。右が、その画像を線画(Scribble)としてAI生成した画像 11月13日掲載の記事「爆速化する画像生成AI」で紹介した新技術「Latent Consistency Models(LCM)」が大爆発しています。これは画像生成AIに2度目の革命を起こした「ControlNet」に次ぐ大インパクトではないかと感じています。「LCM-LoRA」(LoRAはStable Diffusion用の追加学習モデル)が11月下旬に登場したことで、リアルタイム生成のAI機能を組み入れたサービスやアプリの開発が一気に進みました。 なかでも、筆者にとってインパクトが大きかったのが、ペイントソフト「Krita」向けに開発された「Generative AI for Krita」。Kritaはスウェー

    これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした (1/5)
    stealthinu
    stealthinu 2023/12/04
    リアルタイム生成出来るようになったことで画像生成というかツールとしての「体験」が全く変わりつつあるという話。量の進歩が一定以上進むと質の変化が起こるみたいな話でもある。
  • UE5 Niagara で 3D Gaussian Splatting を描画する

    「Unreal Engine (UE) Advent Calendar 2023 その2」2日目の記事です。 3D Gaussian Splattingは簡単にリアルなシーンが作れて楽しいですね。 その描画に必要な処理をNiagaraで実装し、UE5で描画する方法を解説します。 1から10までのステップバイステップのガイドというより、描画の原理を理解することを目的としたドキュメントです。 なお、稿で述べる方法はUE Marketplaceのこちらの商品に実装されています。 背景 3D Gaussian Splattingのデータ表現形式 3Dモデルを「楕円体」(ラグビーボールのような立体)の集合として表現します。点群に似ていますが、個々の点が「点」ではなく「楕円体」になっているイメージです。 個々の「楕円体」は位置・向き・サイズ(UE風に言えばTransform)とRGBAの色を持ちます

    UE5 Niagara で 3D Gaussian Splatting を描画する
    stealthinu
    stealthinu 2023/12/02
    UE5で3D Gaussian Splattingを描画する方法についての説明。表示実装方法の説明なのだがそのおかげで3D Gaussian Splattingがどういう仕組になっているか理解が深まった。
  • https://github.com/PINTO0309/PINTO_model_zoo/tree/main/425_Gold-YOLO-Body-Head-Hand

    stealthinu
    stealthinu 2023/12/01
    YOLOの人体、顔、手の検出器をすごい高精度なアノテーションデータを使って学習させてすごく速く精度高くしたもの… まさに精度高い学習データこそ正義!!それを自らの手で証明。すごすぎ。
  • リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan

    ポイント SDXL Turboは、新しい蒸留技術によって最先端の性能を達成し、これまでにない品質のシングルステップ画像生成を可能にし、必要なステップ数を50から1に削減 非商用研究ライセンスでのリリース(Hugging Faceのモデルウェイトとコードをダウンロードしてください。) Clipdrop にてベータ版を公開中 新しいテキスト画像合成モードである SDXL Turbo をご紹介します。SDXL Turbo は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術に基づいています。この技術により、SDXL Turbo は1つのステップで画像出力を合成し、高いサンプリング忠実度を維持しながらリアルタイムでテキストから画像への出力を生成することができます。技術的な詳細に興味のある研究者や愛好家のために、研究論文はこちらで

    リアルタイムテキスト画像生成モデル、SDXL Turboのご紹介 — Stability AI Japan
    stealthinu
    stealthinu 2023/11/29
    敵対的拡散蒸留(Adversarial Diffusion Distillation)ADDという手法で少ないステップ数で高品質な絵を作れる。LCMとはまた違った手法。すげえな。
  • LucidDreamer

    stealthinu
    stealthinu 2023/11/26
    生成画像や写真から深度推定したものを使って3D Gaussian splattingで3Dモデル化するという手法。だいぶ自然な感じになる。
  • Midjourneyを1年間使って見つけた、Webデザインに使えるプロンプト全ガイド

    「どうすればAIWebデザインに活用できるだろう」 人工知能AIがこれだけ話題になったいま、Webやグラフィックデザイン、イラストゲームなどクリエイティブな業務をこなす人なら、一度は考えたことがあるかもしれません。 答えのひとつはずばり、Midjourneyなどの画像生成AIでイメージを具現化すること。 しかし、そうは言っても入力できるプロンプトは無限にあり、実際にどのように入力すれば最高の結果を得ることができるのか、すべて調べるのはあまりにも大変です。 そこでこの記事では、Midjourneyを1年間使い続けて見つけた、Webデザインに使えるMidjourneyプロンプト、小技テクニックをまとめてご紹介します。 具体的なサンプル例とプロンプトを一緒に記載しており、コピペでそのまま利用できます。 「Midjourneyって何?」というひとは、基の使い方をまとめた以下のガイドを参考にど

    Midjourneyを1年間使って見つけた、Webデザインに使えるプロンプト全ガイド
    stealthinu
    stealthinu 2023/11/14
    画像生成を使ってWebデザインのアイデアを作ってもらう使い方。現時点だと全部作らせるツール系よりこっちの用途のほうがマッチしてる気がする。
  • 【西川和久の不定期コラム】 Stable Diffusion高速化技術続々登場!TensorRT、SSD-1B、LCMなどを試してみる

    【西川和久の不定期コラム】 Stable Diffusion高速化技術続々登場!TensorRT、SSD-1B、LCMなどを試してみる
    stealthinu
    stealthinu 2023/11/09
    SDの最近の高速化手法について。TensorRTやSSD-1Bという(蒸留した?)小型化モデル、そしてLatent Consistency Model。ぜんぜん追ってなかったがLCMはまだいまいちなんだ。
  • 生成AIは人間の「浅はかさ」を暴露する装置でもある――「バーベンハイマー」が浮き彫りにしたもの:大山顕 | 記事 | 新潮社 Foresight(フォーサイト) | 会員制国際情報サイト

    プロンプトによって欲望を視覚化するプロセスには、「考える」時間が差し挟まれる余地はない。インスタ写真に添えられる大量のハッシュタグ、あるいは事細かなカテゴリー分けがされていくポルノとも通底する「表面的語句」の強力な作用は、画像生成AI人工知能)の設計思想の根幹にも及んでいる。「バーベンハイマー」画像のおぞましさは、プロンプトを入力した者がなにひとつ考えず、感じないままだというところにある。 *** 過日「Barbenheimer(バーベンハイマー)」というインターネットミームが物議を醸した。Barbenheimerとは「バービー」と「オッペンハイマー」から生まれた造語である。米国で大ヒット中の映画『バービー』のキャラクターに原爆のキノコ雲などを合成した画像が大量に作られ、各種SNSにポストされた。なぜバービーにキノコ雲なのか。『バービー』と、原爆を開発した物理学者を描いた映画『オッペンハ

    生成AIは人間の「浅はかさ」を暴露する装置でもある――「バーベンハイマー」が浮き彫りにしたもの:大山顕 | 記事 | 新潮社 Foresight(フォーサイト) | 会員制国際情報サイト
    stealthinu
    stealthinu 2023/11/06
    画像生成系への批判ではなく、脊髄反射的に絵が作れるようになったことで、それを使う人間が見えてくるという話。
  • 3D Gaussian Splatting : 複数視点の画像から3D空間を再現する最新手法

    複数視点の画像から3D空間を再現する最新手法である3D Gaussian Splattingの紹介です。3D Gaussian Splattingを使用することで、3D空間を学習し、リアルタイムにレンダリング可能です。 3D Gaussian Splattingの概要3D Gaussian Splattingは2023年8月に発表された、複数の視点の画像から3D空間を再現する手法です。3D空間をガウシアンの集合として定義し、各ガウシアンのパラメータを機械学習で求めることで、レンダリング時は機械学習を不要とし、高速なレンダリングが可能です。

    3D Gaussian Splatting : 複数視点の画像から3D空間を再現する最新手法
    stealthinu
    stealthinu 2023/11/01
    NeRFと3D Gaussian Splattingの技術的差異についてわかりやすく説明されていた。NeRFがレイトレとしたらGaussian Splattingは楕円を使ったレンダリングと。
  • Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers

    stealthinu
    stealthinu 2023/10/15
    Transformer使うことでVQGANの性能が大幅にあげれるという論文。これLyraの音声エンコードのVQにも応用できそう?