並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 258件

新着順 人気順

"computer vision"の検索結果1 - 40 件 / 258件

"computer vision"に関するエントリは258件あります。 AI人工知能技術 などが関連タグです。 人気エントリには 『画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)』などがあります。
  • 画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)

    Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

      画像生成AIが爆速で進化した2023年をまとめて振り返る (1/5)
    • 【初心者向け】iPhone 3Dスキャンパーフェクトガイド|iwama

      こんにちはiPhone3Dスキャンを日本中に普及させる男ことiwamaです。 2020年の10月にiPnone12Proシリーズに初めてLiDARセンサーが搭載され、現在では様々な業界でiPhoneの3Dスキャンが活躍し始めています。 そこで今回はiPhone3Dスキャンって何?でどういうアプリがあるの?などの初心者向けの解説を行っていこうと思います。 ※この記事は2023年2月3日に、より初心者向けの記事になるよう大規模な改修作業を行いました。 自分の記事を読んで為になったという方にお願いです。可能な限りで良いので令和6年能登半島地震の被災地支援のため募金活動をよろしくお願いします。 3Dスキャンについて学ぼうそもそも3Dスキャンって何?現実にある物体や空間をデジタル3Dデータ化する技術の事を(このnote内では)3Dスキャンといいます。 3Dスキャン技術には様々なモノが存在していますが

        【初心者向け】iPhone 3Dスキャンパーフェクトガイド|iwama
      • iPhoneで始める3Dスキャン生活|iwama

        皆さん!3Dスキャンしてますかーーーーー!? どうもiPhone3Dスキャン大好きおじさんです。今回はiPhoneで始める3Dスキャンというお話をしていこうと思います。 iPad Pro(2020)にLiDARセンサーが搭載されたことで3Dスキャンが誰でも出来る時代が到来しました。 ただいきなりiPhoneやiPadで3Dスキャンができるよ!と言われてもピンとこない方が大半だと思うので、今回のnoteでは簡単な3Dスキャン技術の紹介からスキャンアプリ、スキャン方法などを説明していこうと思います。 3Dスキャンのざっくりとした区分まず3Dスキャンとは何なのかという話ですが、3Dスキャンとは現実にある物体を様々な手法でスキャンし、それをコンピュータ上で再現することだと個人的に思っています(もしかしたら違うかも) 3Dスキャンの方法としては、写真から3Dモデルを作成するフォトグラメトリとレーザー

          iPhoneで始める3Dスキャン生活|iwama
        • AIがこの世にいない人の顔画像を大量生成する、著作権フリーの画像が10万枚! | Techable(テッカブル)

          創作AIの進化は予想以上に速く、気づけば創作物の多くをAIが担っていた…なんて状況も、信憑性を帯びてきた。クオリティの高い創作物を大量生成するAIの出現で、著作の使用料体系に崩壊が起きる可能性がある。 ヒトの書いたものと見分けがつかないような文章を生成する「GPT-2」の登場も衝撃的だったが、真っ先に市場にインパクトを与えそうなのが画像の領域だ。 Webサイト、generated.photos上に、著作権フリーのオリジナル顔画像10万枚が公開された。あらゆるシーンでハイクオリティの顔画像が利用可画像生成AIは、悪用されることでマイナスの影響もあるが、著作権フリーの画像が出回れば自身の創作の幅が広がり、恩恵を受ける方も多いだろう。同プロジェクトは、まさにこれを狙ったものだ。 GAN(敵対的生成ネットワーク)による画像生成は、ヒトやネコ、アニメキャラから賃貸物件まで、たくさんの対象で試されてい

            AIがこの世にいない人の顔画像を大量生成する、著作権フリーの画像が10万枚! | Techable(テッカブル)
          • 伊藤園「おーいお茶」CMに生成したAIタレントを起用

            伊藤園が「お~いお茶 カテキン緑茶」のテレビCMにAIタレントを起用した。AIタレント事業を手がける企業AI modelが、自社のAIタレントが採用されたことを10月3日に公表した。 CMに登場するAIタレントの名称は明らかにされていない。CMはテレビのほか、伊藤園の公式YouTubeチャンネルでも公開されており、本物の人間と見分けがつかないレベルの仕上がりだ。 AI modelによると、AIタレントが登場するテレビCMは日本初になるという。 同社は発表に際して「AI技術で生成したAI model(AIモデル)を活用して、モデル撮影の創造性や表現の豊かさを広げて、そこから得られる新しい価値などを提供していくことで、広告やファッションなど様々な業界の発展に貢献していきます」と述べている。 「お~いお茶 カテキン緑茶」シリーズは伊藤園が9月4日より販売を開始した製品。同シリーズはテレビCM以外

              伊藤園「おーいお茶」CMに生成したAIタレントを起用
            • 距離センサ入門(ステレオカメラ、プロジェクション、LiDAR) - arutema47's blog

              Qiitaからのお引越し記事です。 目標 ステレオカメラ 概要 特徴 使用製品 パターンプロジェクションカメラ 概要 使用製品 iPhone ゾゾスーツ 工業製品(Ensenso, キーエンス) Time of Flight LiDAR Time of Flightの原理 特徴 スキャン型LiDAR フラッシュ型LiDAR 製品 Velodyne Series 追記 Livox Horizon iPhone iToF LiDAR 目標 通常のカメラは物体の明るさ、色を抽出するのに対し、距離センサは物体までの距離をセンシングします。そのため3DカメラやDepth Sensorなどと呼ばれたりします。 距離を知ることは多様なアプリケーションにおいて重要であり、例えば自動運転では前方車両までの正確な距離を知ることは必須です。またゲームなどのアプリケーションでは人の動作などを距離センサで抽出するK

                距離センサ入門(ステレオカメラ、プロジェクション、LiDAR) - arutema47's blog
              • 「売れなかった」ハムサンド、カメラ50台で真相解明 高輪GW駅「無人決済コンビニ」の実力

                「売れなかった」ハムサンド、カメラ50台で真相解明 高輪GW駅「無人決済コンビニ」の実力:開業から3カ月、成果は(1/3 ページ) 2020年3月14日に開業したJR山手線・京浜東北線の高輪ゲートウェイ駅。山手線の新駅としては約50年ぶりとなるだけに注目度は高く、開業初日には多くの観光客も訪れた。その一角で、注目を集めている店舗がある。AI(人工知能)技術を活用した無人コンビニ店舗「TOUCH TO GO」だ。有人レジはなく、来店客は店内で商品を手に取り、出口付近で「Suica」などを読み取り機にかざすだけで買い物を済ませられる。 こうした無人決済店舗は、米国では「Amazon Go」をはじめ実用化された例があるが、日本では長らく実験段階にとどまっていた。そうした中、TOUCH TO GOは国内では珍しい実用化事例として小売・流通業界はもちろん、他業界からも高い注目を集めている。無人もしく

                  「売れなかった」ハムサンド、カメラ50台で真相解明 高輪GW駅「無人決済コンビニ」の実力
                • バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に

                  ライセンスは「CC BY-NC-ND 4.0」で、利用の際にクレジットを表示すること、非営利でのみ利用すること、内容を改変しないことを求めている。 バンダイナムコは、メタバースやXR技術が広まる中、コンテンツ規模が拡大すると従来のモーション制作過程では限界を迎えると予想。AIを活用したキャラクターのモーションを生成する研究を行っている。 一方、AIによるモーション研究はデータセットの入手が難しいため研究開発が進んでいないとして、自社で使っているデータの一部を提供することにしたという。 関連記事 実在しない顔の画像3000点を無償配布、AI学習用データセットに 法人向け・商用利用可 AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。

                    バンナム、約42万フレーム分のモーションデータ無償公開 歩行、格闘、ダンスなど 研究用に
                  • 年末年始に振り返る 2021年の人工知能10大トレンドと必読論文

                      年末年始に振り返る 2021年の人工知能10大トレンドと必読論文
                    • Microsoftが誰でも簡単に機械学習モデルが作れるツール「Lobe」を公開! | Techable(テッカブル)

                      Microsoftは、WindowsやMacにダウンロードして無料で使える「Lobe」を公開している。同ツールでは、ネット接続やログインもなしで機械学習トレーニングができて、利用するデータはプライベートに保たれる。 Microsoftは2018年にLobeを買収し、同ツールをブラッシュアップしてきた。今では、誰でも簡単に機械学習モデルがトレーニングできるように…とのコンセプトを体現したものになっている。写真をインポートすれば自動でトレーニングLobeのWebサイトに掲載の紹介動画を観れば、このツールのシンプルな使い勝手が認識できるだろう。ナビゲーターがPCのWebカメラで水を飲む写真を複数通り撮影。同じく水を飲んでいないシーンを撮影すると、トレーニングが自動で行われる。 ラベルを調整して、Webカメラの前で水を飲むと「水を飲む」動作が検出できるように。また、モデルの修正も簡単にできるようだ

                        Microsoftが誰でも簡単に機械学習モデルが作れるツール「Lobe」を公開! | Techable(テッカブル)
                      • ユーザー認証は「お尻の穴」──尿や便で健康状態をチェックするスマートトイレ 米研究

                        トイレにガジェットやセンサーを取り付けることで、用を足した人の尿や便から健康状態をチェックするシステムを開発した──米スタンフォード大学医学大学院は4月6日(現地時間)、こんな研究結果を発表した。備えたカメラの映像と機械学習で、肛門の模様などからユーザーを特定し、尿の成分や流量、便の形状から、医師と同程度の精度で健康状態をチェックできるという。 研究チームは、洋式トイレの便座に圧力センサーやモーションセンサー、尿検査試験紙、各種カメラを設置した。 研究チームが開発したスマートトイレシステム。指紋と肛門でユーザー認証し、尿や便から得られた健康情報をクラウドサービスに送れる(画像は論文から引用) まず圧力センサーでユーザーが便座に座ったことを検知。モーションセンサーで放尿を検知すると、尿成分分析の試験紙の位置を調整する。2台の小型ハイスピードカメラ(GoPro HERO7)を用いて尿の流れを撮

                          ユーザー認証は「お尻の穴」──尿や便で健康状態をチェックするスマートトイレ 米研究
                        • AIで数千人を瞬時にカウントできる技術をキヤノンが開発、計測誤差は5%以内を実現 | Ledge.ai

                          12月19日、キヤノンは、ディープラーニング(深層学習)を用いて、ネットワークカメラで撮影した映像から、数千人規模の群衆人数をリアルタイムにカウントする映像解析技術を開発したと発表。あわせて、この技術を搭載した映像解析ソフトウェア「People Counter Pro」を12月下旬から発売する。(外部サイト) キヤノンに価格を問い合わせたところ、システム構成によって大きく変わる可能性があるものの、XProtect版の場合はおおよそ100万円~(サーバー、カメラ、ライセンス含む)だそうだ。 キヤノンによれば、 「2018年に開催されたラグビーの国際試合での実証実験では、キヤノンの群衆人数カウントの技術によって約6千人を数秒でカウントできました。実証実験後の画像を人手で確認した人数と、ソフトウェアによるカウント人数の差は5%以内に収まり、ほぼリアルタイムで、群衆人数を正確に把握することに成功し

                            AIで数千人を瞬時にカウントできる技術をキヤノンが開発、計測誤差は5%以内を実現 | Ledge.ai
                          • AI素材.com

                            公式コラボAI素材の利用が可能 「いらすとや」 をはじめとした公式コラボAI素材も利用することができます(今後も順次増えていく予定)。

                              AI素材.com
                            • 文化庁の「AIと著作権」の解釈が話題に AIに詳しい弁護士「かなり踏み込んだ内容」

                              内閣府が公開している資料「AIと著作権の関係等について」がTwitterで話題になっている。文化庁が制作した資料で、5月15日に開催した内閣府のAI戦略チームの会議で使用されたもので、AIと著作権に関する現行法での見解などをまとめている。6月3日頃からTwitter上で話題になっており、AIに詳しい弁護士も「かなり踏み込んだ内容」と見解を述べている。 同資料では、著作権の役割は「『思想又は感情を創作的に表現した』著作物を保護するもの」と指摘。データ(事実)やアイデア(作風や画風)は著作物に含まれないという。 この上で、AIと著作権の関係は「生成・利用段階」と「AI開発・学習段階」を分けて考えるべきと説明している。AIが生成した画像などを公開したり、そのイラスト集を販売したりする場合は、通常の著作権侵害と同様の法が適当される。AI画像と既存の著作物との類似性や依拠性(既存の著作物を基に創作し

                                文化庁の「AIと著作権」の解釈が話題に AIに詳しい弁護士「かなり踏み込んだ内容」
                              • Google・Niantic・Appleが相次いで仕掛ける「VPS」とはなにか【西田宗千佳のイマトミライ】

                                  Google・Niantic・Appleが相次いで仕掛ける「VPS」とはなにか【西田宗千佳のイマトミライ】
                                • OCR処理プログラム及び学習用データセットの公開について | NDLラボ

                                  2022年04月25日 NDLラボのGitHubから、次の2件を公開しました。ライセンスや詳細については、各リポジトリのREADMEをご参照ください。 NDLOCR 国立国会図書館(以下、「当館」とします。)が令和3年度に株式会社モルフォAIソリューションズに委託して実施したOCR処理プログラムの研究開発事業の成果である、日本語のOCR処理プログラムです。 このプログラムは、国立国会図書館がCC BY 4.0ライセンスで公開するものです。なお、既存のライブラリ等を利用している部分については寛容型オープンライセンスのものを採用しているため、商用非商用を問わず自由な改変、利用が可能です。 機能ごとに7つのリポジトリに分かれていますが、下記リポジトリの手順に従うことで、Dockerコンテナとして構築・利用することができます。 リポジトリ : https://github.com/ndl-lab/

                                  • Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース

                                      Microsoft、検索しても出てこない画像を代わりにAIで生成する技術を「Bing」に実装/OpenAIの画像生成AI「DALL-E 2」ベース
                                    • ZoomやSkypeでリアルタイムに他人になりすませるオープンソースのディープフェイクツール「Avatarify」

                                      自宅からリモートワークを行う際、ZoomやSkypeといったオンラインビデオ会議ツールを使用するケースがよくあります。オンラインビデオ会議ツールではウェブカメラを使って自分の顔を映しますが、アルゴリズムで別人になりきってオンラインビデオ会議に参加できるオープンソースのディープフェイクツール「Avatarify」が公開されています。 GitHub - alievk/avatarify: Avatars for Zoom and Skype https://github.com/alievk/avatarify This Open-Source Program Deepfakes You During Zoom Meetings, in Real Time - VICE https://www.vice.com/en_us/article/g5xagy/this-open-source-pro

                                        ZoomやSkypeでリアルタイムに他人になりすませるオープンソースのディープフェイクツール「Avatarify」
                                      • AI生成作品に対する、FANBOXにおける今後の対応|pixivFANBOX公式|pixivFANBOX

                                        いつもFANBOXをご利用いただきありがとうございます。 現在、FANBOXにおけるAI生成作品の取り扱いに関して多くのご意見をいただいております。急激に発展している技術への対応が追いついておらず、皆さまにご迷惑をおかけしていることを深くお詫び申し上げます。 皆さまからのご意見や現状を考慮し、私たちFANBOX運営の...

                                          AI生成作品に対する、FANBOXにおける今後の対応|pixivFANBOX公式|pixivFANBOX
                                        • 「監視カメラの画像認識をだます服」をハッカー兼ファッションデザイナーが発表

                                          ハッカーでありファッションデザイナーでもあるケイト・ローズ氏は、2019年8月8日(木)から8月11日(日)までラスベガスで開催されたセキュリティイベント「DEFCON27」で、「Adversarial Fashion(敵対的ファッション)」というオリジナルブランドを発表しました。Adversarial Fashionの服は自治体や政府が設置している監視システムに干渉するようなデザインとなっていて、監視カメラから個人の特定を防ぐことができるとのことです。 Adversarial Fashion https://adversarialfashion.com/ The fashion line designed to trick surveillance cameras | World news | The Guardian https://profile.theguardian.com/pr

                                            「監視カメラの画像認識をだます服」をハッカー兼ファッションデザイナーが発表
                                          • AIが大量生成、実在しない「フェイク顔」がトランプ氏を支持する(平和博) - エキスパート - Yahoo!ニュース

                                            AIが自動生成する実在しない「フェイク顔」のアカウントが、フェイスブックを舞台に大量発生し、トランプ大統領の再選を支持する――。 こんな新たな動きが注目を集めている。 フェイスブックはこの動きに対し、600を超すアカウント、さらに関連するフェイクブックページやグループの削除を発表した。 またフェイスブックの発表と合わせて、大手シンクタンクなどが調査報告書を公表。AIによる「フェイク顔」アカウントが大量発生する仕組みを解き明かしている。 「フェイク顔」「アカウント」「投稿」と、AIが絡んだ自動化によって拡散の波をつくりだす、フェイクネットワークの“製造工程”。その一端を、この騒動から垣間見ることができる。 フェイクニュースの生態系は、加速度的に複雑さを増している。 ●610のアカウント削除フェイスブックは20日、「組織的不正行為(CIB)」に対する、大規模なアカウント削除などの措置を発表した

                                              AIが大量生成、実在しない「フェイク顔」がトランプ氏を支持する(平和博) - エキスパート - Yahoo!ニュース
                                            • ユニクロ、カメラで体を採寸してサイズを提案する「MySize CAMERA」

                                                ユニクロ、カメラで体を採寸してサイズを提案する「MySize CAMERA」
                                              • ラズパイで画像認識、1日30円~のエッジAIが快進撃

                                                3000円台で手に入るシングルボードコンピュータ「Raspberry Pi」の性能をフルに生かした、エッジAIプラットフォームを展開しているスタートアップ企業がある。今年で創業5年になるIdein(イデイン、東京都千代田区)だ。「第1回 AI・人工知能EXPO【秋】」(幕張メッセ、10月28~30日)に出展した同社のブースを取材した。

                                                  ラズパイで画像認識、1日30円~のエッジAIが快進撃
                                                • ついにPhotoshopへ驚異的AI機能「ジェネレーティブ塗りつぶし」追加へ、「画像の続きを生成する機能」「被写体を生成して画像内に追加」などができベータ版で利用OK

                                                  Adobeが画像編集アプリ「Photoshop」にジェネレーティブAI「Firefly」を統合し、AI機能「ジェネレーティブ塗りつぶし」を追加することを発表しました。「ジェネレーティブ塗りつぶし」では「画像の続きを生成」「画像の一部をAIで生成した画像に置き換え」といった操作を実現可能です。 アドビ | Adobe https://www.adobe.com/jp/ Photoshopに搭載されるAI機能「ジェネレーティブ塗りつぶし」はこんな感じ - YouTube 「ジェネレーティブ塗りつぶし」の実例こんな感じ。まず、画像の一部を選択状態にします。 続いて「Generative Fill(ジェネレーティブ塗りつぶし)」をクリック。 すると、道路上のタイヤ痕が消えました。 続いて道路の中央部分を選択。 「yellow road lines(黄色い車線)」と入力して「Generate」をクリ

                                                    ついにPhotoshopへ驚異的AI機能「ジェネレーティブ塗りつぶし」追加へ、「画像の続きを生成する機能」「被写体を生成して画像内に追加」などができベータ版で利用OK
                                                  • 商用利用OKの画像生成AI「Emi」公開 クリエイターと対話して開発、無断転載画像不使用

                                                    「AIいらすとや」など、権利クリアな画像生成AIを開発してきたAI Picasso社は、アニメ・マンガ風のイラストを生成できる画像生成AI「Emi」(Ethereal master of illustration)を9月25日に無償公開した。 Stable Diffusionベース。追加学習で無断転載画像を学習させておらず、権利がクリアな点が特徴。商用利用も可能だ。 Stable Diffusion XL 1.0と NVIDIAのGPU「H100」に、同社のノウハウを組み合わせて開発。最近の画風になるよう調整した。 追加学習に「Danbooru」などの無断転載サイトを使っていない。クリエイターの意見を聞きながら開発したという。 同社の従来のモデルと異なり商用利用可能にした。画像生成AI普及に伴い、創作業界に悪影響を及ぼさないようマナーを守る人が増えてきたことや、他の画像生成AIが商用可能な

                                                      商用利用OKの画像生成AI「Emi」公開 クリエイターと対話して開発、無断転載画像不使用
                                                    • “AIトイレ”で大便の状態を自動判定、LIXILが開発 「教師データは社員の便」 介護施設などの需要見込む

                                                      住宅設備機器などを手掛けるLIXILが、大便の形状や大きさを国際指標に基づいて自動分類できる“AIトイレ”のプロトタイプを、家電やIoT機器の見本市「CEATEC 2019」(10月15日~18日、千葉・幕張メッセ)で展示している。実用化のめどは立っていないが、介護施設などでの利用を想定。介護施設のスタッフは判定結果を見て、入居者の体調管理に役立てられるという。 便器の内部にセンサーカメラを搭載。利用者が排便すると瞬時に大便を画像認識し、形状を7段階、大きさを3段階でそれぞれ自動判定する。AIが判定したデータは、ネットワークを経由して管理者のPCに集約する。

                                                        “AIトイレ”で大便の状態を自動判定、LIXILが開発 「教師データは社員の便」 介護施設などの需要見込む
                                                      • 落書きを即3Dモデル化、つまんで動かし即アニメーションに Googleなど「Monster Mash」開発

                                                        Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 チェコ工科大学、米Google Research、スイス・チューリッヒ工科大学による研究チームが開発した「Monster Mash」は、手描きスケッチでモデリングとアニメーションを手軽に行えるツールだ。落書きのように大ざっぱに描いた絵から3Dモデルを素早く展開し、キャラクターの一部をつまんで移動させるだけでリアルタイムにアニメーションを作成できる。

                                                          落書きを即3Dモデル化、つまんで動かし即アニメーションに Googleなど「Monster Mash」開発
                                                        • 日本の警察は、今年3月から防犯カメラやSNSの画像を顔認証システムで照合していた

                                                          全国の警察で3月から民間の防犯カメラやSNSの画像を顔認証システムで照合していた......  (写真とは関連がありません) REUTERS/Thomas Peter <全国の警察で3月から民間の防犯カメラやSNSの画像を顔認証システムで照合していたことを共同通信が報じた......> 前々回の記事「日本の警察は世界でも類を見ない巨大な顔認証監視網を持つことになるのか?」では、顔認証システムの拡充が進んでいることと、警視庁がリアルタイムで民間の監視カメラを一元管理し、顔認証システムで識別するシステムを持っていることをご紹介し、今後さらに拡充されていく可能性を指摘した。 それを裏付けるように9月12日に共同通信が全国の警察で3月から民間の防犯カメラやSNSの画像を顔認証システムで照合していたことを報じた(47NEWS、2020年9月13日)。日本の先を行くアメリカで顔認証システムの利用の見直

                                                            日本の警察は、今年3月から防犯カメラやSNSの画像を顔認証システムで照合していた
                                                          • Teslaにおけるコンピュータビジョン技術の調査

                                                            社内勉強会での発表資料です。公開情報をもとにTeslaのコンピュータビジョン技術について調査したものです。Read less

                                                              Teslaにおけるコンピュータビジョン技術の調査
                                                            • コンピュータビジョン今昔物語 - 深層学習がCVの世界をどう変えたか - (JPTA Tech Talk講演資料) - takminの書きっぱなし備忘録 @はてなブログ

                                                              今回、CV勉強会に何度か参加&発表していただいたJin Yamanakaさんにお誘いいただき、JTPA (Japan Technology Professional Association)というところで、「コンピュータビジョン今昔物語 -深層学習がCVの世界をどう変えたか-」という大上段なタイトルで講演させていただきました。 www.meetup.com このJTPAのTech Talkでは、機械学習/深層学習の勉強会を開催してきたそうなのですが、私自身「これ」という深層学習の専門があるわけではないので、コンピュータビジョン全体の基礎的な技術の変遷を、深層学習と絡めて広く浅く網羅した話をさせていただきました。 ちなみにここで紹介した深層学習の技術は、「既存の技術を置き換えるために、深層学習は何をクリアしなくてはならないか?」という視点で、紹介するのが適当と思ったものを選んだつもりです。

                                                                コンピュータビジョン今昔物語 - 深層学習がCVの世界をどう変えたか - (JPTA Tech Talk講演資料) - takminの書きっぱなし備忘録 @はてなブログ
                                                              • LiDARのないiPhoneで3Dスキャン可能に 米Nianticの「Scaniverse」

                                                                「Pokemon GO」(ポケモンGO)などのARゲームで知られる米Nianticは9月14日(現地時間)、iOS向け3Dスキャンアプリ「Scaniverse」がLiDARを持たないiPhoneにも対応すると発表した。iPhone XS以降の全てのiPhoneと過去4年間に発売されたほとんどのiPadで利用できるという。 LiDARに代わり、ニューラルネットワークを活用してカメラ画像から奥行きを推測する「ManyDepth」技術を搭載した。建物など大きな空間に適した「Areaモード」と人物やオブジェクトの細部を捉える「Detailモード」があり、DetailモードならScaniverseフォトグラメトリ処理を活用してLiDAR搭載デバイスと同等の高品位なスキャン結果が得られるとしている。 「LiDARを搭載していない端末でもScaniverseを利用したいという要望が多かった。(ManyD

                                                                  LiDARのないiPhoneで3Dスキャン可能に 米Nianticの「Scaniverse」
                                                                • “レジのないスーパー”オープン 商品手に店出れば買い物終了 | NHKニュース

                                                                  新型コロナウイルスの感染拡大が続く中、スマートフォンを持って入店し買いたい商品を手に取り店を出るだけで買い物を終えられる、レジのないスーパーがオープンしました。 この店舗はダイエーとNTTデータが、江東区にあるNTTデータの社内にオープンさせました。 店内にはレジがないのが特徴で、客はスマートフォンにQRコードを表示させて入店し買いたい商品を手に取って店を出ると、あらかじめ登録したクレジットカードで支払いを終えることができます。 客が購入した商品は、店内の32台のカメラと商品の棚に搭載された重さを量るセンサーで把握する仕組みになっています。 また弁当などの値引き情報を客のスマホに送る機能もあり、店員が値引きを知らせるシールを商品に貼る手間も省けるということです。 両社はこの店で課題などを検証し、今後こうした店を増やしていきたいとしています。 NTTデータの内山尚幸SDDX事業部長は「マンシ

                                                                    “レジのないスーパー”オープン 商品手に店出れば買い物終了 | NHKニュース
                                                                  • 研究ツールまとめ2023|cvpaper.challenge

                                                                    はじめに今年の夏, MIRU 2023 チュートリアルにて「CVPR 2023 速報」[Full ver.] [MIRU ver.]を発表させて頂きました. MIRU2023会期中, 非常に辛(から)かった飲み会の席にて偶然にも面白いB4の学生さん(Oさん)とお話する機会がありました.その出会いをきっかけに, Oさんとは共同主著を前提として共同研究を実施させて頂くことになりました. もちろん, OさんはB4の学生さんということもあり, 初めての研究でコーディング未経験という状態からのスタートです. かねがね, cvpaper.challenge研究メンバーとしても, 極めて変化の激しいコンピュータビジョン分野にてトレンドを創出するためには, どのように効率的に研究を進めていけば良いのか, 研究メンバーのプレゼンスを最大化するための方法論については片岡さんとも相談を重ねていました. また,

                                                                      研究ツールまとめ2023|cvpaper.challenge
                                                                    • 無料で写真から3Dプリント出力可能なモデルを生成できるオープンソースの3D再構築ソフト「Meshroom」

                                                                      3D再構成とカメラ追跡アルゴリズムを提供するフォトグラメトリフレームワークのAliceVisionに基づくオープンソースの3D再構成ソフトが「Meshroom」です。MeshroomはWindowsとLinux向けにリリースされており、無料でインストールすることができます。 AliceVision | Meshroom - 3D Reconstruction Software https://alicevision.org/#meshroom Meshroomがどんなソフトなのかは以下のムービーを見ればよくわかります。 Photogrammetry 2 – 3D scanning with just PHONE/CAMERA simpler, better than ever! - YouTube Meshroomは複数の大学やラボの協力によって開発された、フォトグラメトリソフトウェアです

                                                                        無料で写真から3Dプリント出力可能なモデルを生成できるオープンソースの3D再構築ソフト「Meshroom」
                                                                      • 商用可、「いらすとや」風の画像をAIが生成してくれる「AIいらすとや」がリリース/月額1,480円。無料で試すことも可能

                                                                          商用可、「いらすとや」風の画像をAIが生成してくれる「AIいらすとや」がリリース/月額1,480円。無料で試すことも可能
                                                                        • Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】 - Qiita

                                                                          Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】RaspberryPiTensorflowLitexnnpack 1. はじめに 今から半年前の2020年6月、ラズパイ4上でTensorFlow Liteを使った様々なAI認識アプリを動かしてみて、その動作速度をまとめました。 当時のTensorFlowはバージョン2.2でしたが、現在は 2.4(rc4) へと進んでいます。進化が極めて速いDeepLearningの世界において、この半年間でTensorFlow Liteはどう変化したでしょうか。もし「手持ちのアプリは何も変えてないのに、TensorFlow Liteを新しくするだけでめっちゃ速く動くようになったぜ」というのだと嬉しいですよね。 本記事では、前回計測に用いたアプリを再び最新版のTensorFlow Lite環

                                                                            Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】 - Qiita
                                                                          • AI作品の取り扱い一時停止について  | ファンティア スポットライト[Fantia Spotlight]

                                                                            いつもファンティアをご利用いただきありがとうございます。 ファンティア運営事務局です。 ファンティアでは2022年10月25日よりAI作品専用のカテゴリを新設し、AI作品を分けて表示する等の取り組みを行って参りました。 しかし、昨今の状況を鑑み、クリエイター様とその作品を守る対応が必要と考え、 ファンティアではAI生成による作品の取り扱いを一時停止させていただく運びとなりました。 今後、利用規約の改定とAI生成による作品の審査の見直しを行って参ります。 方針が決まり次第、利用規約改定のお知らせとともに、皆様にはご連絡をさせていただきます。 AIカテゴリにおいて活動いただいていたクリエイター様にはご迷惑をおかけする形となり、大変申し訳ございません。 何卒ご理解のほど、よろしくお願いいたします。 今後ともファンティアをよろしくお願いいたします。

                                                                              AI作品の取り扱い一時停止について  | ファンティア スポットライト[Fantia Spotlight]
                                                                            • Stable Diffusion発! 画像生成ブームに見るジェネラティブAIの人・もの・お金事情 - NTT Communications Engineers' Blog

                                                                              この記事は NTTコミュニケーションズ Advent Calendar 2022 18日目です…が、少々遅れてお届けします。 はじめに PS本 5G&IoTサービス部 増田です。Advent Calendar参加も(たぶん)3年目となりました。 「テキスト指示をもとに、AIがお好みの画像を生成する(Text-to-Image)」「今ある画像へ、テキスト指示で編集を加える(Image-to-Image)」 -- そんな画像生成AIが注目を集めています。2022年の上半期、Open AIによるDALL-E 2の公開、Midjourneyの登場と盛り上がりを見せました。2022年8月23日のStable Diffusion一般公開からは、使ってみた報告、従来研究との融合、商用プロダクト応用と、研究者、アーティスト、プログラマなど様々な人の参加により、界隈はさらに活気づいています。 画像生成AIの

                                                                                Stable Diffusion発! 画像生成ブームに見るジェネラティブAIの人・もの・お金事情 - NTT Communications Engineers' Blog
                                                                              • 数ミリ単位での位置情報取得が可能な「Micro-GPS」が開発される

                                                                                GPSは、スマートフォンや自動車、ドローンなどの位置情報取得に用いられていますが、「室内では位置情報を取得しづらい」「数mm単位での位置情報取得は難しい」といった問題が存在します。そんな中、アメリカ・プリンストン大学の研究チームが地面の情報をスキャンすることで非常に高精度な位置情報を取得するシステム「Micro-GPS」を開発しました。 High-Precision Localization Using Ground Texture https://arxiv.org/abs/1710.10687 Micro-GPS https://microgps.cs.princeton.edu/ Micro-GPSは地面の模様データを基に位置情報を数mm単位で認識可能。以下のムービーではMicro-GPSの仕組みが解説されています。 Micro-GPS ICRA2019 - YouTube Amaz

                                                                                  数ミリ単位での位置情報取得が可能な「Micro-GPS」が開発される
                                                                                • iPhoneの自撮りで本物そっくりな動く3Dリアルアバター 米Metaが技術開発

                                                                                  Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米MetaのReality Labsの研究チームが開発した「Authentic Volumetric Avatars from a Phone Scan」は、スマートフォンで自撮りした短時間のスキャン画像から、本物そっくりの3D頭部アバターを生成するシステムだ。異なる視点やフォトリアリスティックな表情を表現し、高い忠実度で再現する。 現在、実在する人物のアバターを作成するためには膨大な人物データを取得する必要があり、そのデータを収集するには大規模なマルチビューキャプチャーシステムを必要とする。そのため軽量なデータキャプチャー、低遅延、許容できる品質でのアバター作成プロセスを自動化することが

                                                                                    iPhoneの自撮りで本物そっくりな動く3Dリアルアバター 米Metaが技術開発

                                                                                  新着記事