[B! 人工知能] ardarimのブックマーク

実在児童に酷似した性的画像、生成ＡＩで作成か…ネット上で追加学習用データを売買

【読売新聞】　画像生成ＡＩ（人工知能）で、実在の児童に酷似した画像を生成できる追加学習用データが、ネット上で売買されていることがわかった。過去に日本で活動した児童タレントの追加データもあり、追加データで作ったとみられる児童タレントに

ardarim 2024/06/02

リンク

プログラマ視点での生成AIとの付き合い方

プログラミングについて、最近考えてることについてのポエム。基本的に、 GPT-4 と Claude-3-Opus を使った経験を念頭に置いて話をする。機械学習エンジニアではないので、あくまで利用者に徹した視点での話。仕事で生成AIを使ったパイプラインを作ったりはしている。生成AIの進化速度を予測しておく今大事なことは、今AIがどの程度の性能かという定点の話ではなく、その進化の速度を認識すること。コード生成というタスクにおいて、生成AIモデルを人間に当てはめると、こんな感じの人物像を自分は持っている。 GPT-4: プログラミング経験2年目の大学2年生 Claude-3-Opus: プログラミング経験3年目の大学3年生ここでいうn年目は、業務経験ではなく、プログラミングの単位がある大学での、教育課程としての経験年数。今のひたすら学習量を増やす方式だと、単に1年に1年分ぐらい賢くなっ

ardarim 2024/06/01

ドメイン知識は基本的にオープンでなく学習の入力にできないことを考えると業務適用は厳しい。逆にそれを食わせればいい線いくのかも。でも結局はAIの出力を誰が担保するのかという話に行き着く

リンク

実録：AIで描く漫画の実際～AIで今風の手描きっぽい漫画を作ってみる (1/6)

こんにちは、漫画界の生き恥こと野火城と申します。「画像AI使ってみた／AI 漫画実験企画」第2回です！ ■第1回はこちら　実録：AIで描く漫画の実際～体験して見えた、その実力と課題!! その成り立ちから様々な議論を呼んでいる画像生成AIですが、少なくとも2024年3月現在日本の法律では使用が許可されており、存在を完全に無視する事はできません。かといって全てを肯定して受け入れるのも難しい。だからこそ、必要以上に恐れず、実際にどのような事が出来るのか、具体的に検証する――それが画像AIとの誠実な向き合い方なのではないでしょうか。「画像AIの技術がすごいという賞賛記事はよく見るが、それは本当に創作活動で実戦的に使えるものなのか？　『AIに仕事を奪われる』と『今のAIは実戦では使い物にならない』という真逆の意見を多数見るが、この二つは両立しないのでは？　実際はどっちなんだ？」「画像AIを試し

ardarim 2024/05/30

リンク

画像生成AIに照明革命　日本と世界で同時に“神ツール”登場 (1/3)

この連載ではおなじみのキャラクター「明日来子さん」に右側からライトを当ててみた。左がIC-Lightを適用したもので、右がオリジナル。環境はWebUI Forge用の拡張機能を使用 5月8日に、「ControlNet」など画像生成AI関連の著名研究者であるイリヤスフィール（lllyasviel）さんが発表した「ICライト（Imposing Consistent Light、印象的な一貫的なライト）」が盛り上がりました。入力した画像をもとに、後から指定した照明効果を踏まえた画像を生成する技術です。画像生成AIで照明効果がつけられる「ICライト（IC-Light）」発表された学習済みモデルは、「ライトを指定すると、キャラクターのデータに合わせてテキストのプロンプトに合わせて独自に背景を生成するもの」「キャラクターとライトの影響を加味して、別の背景画像と合成するもの」の2種類があります。これ

ardarim 2024/05/27

リンク

グーグル生成AI活用した新たな検索サービスで誤情報が表示 | NHK

アメリカのIT大手グーグルが今月から提供を始めたばかりの生成AIを活用した新たな検索サービスで、誤った情報が表示されたとアメリカのメディアが伝えています。ピザにチーズをくっつけるために接着剤を使うことを勧めるなどの回答が表示され、波紋を呼んでいます。これはグーグルが5月14日に発表し、アメリカで提供が始まった生成AIを活用した検索サービス「AIオーバービュー」です。文章で質問を入力すると生成AIが調べて回答をまとめる機能です。アメリカの有力紙、ニューヨーク・タイムズなどよりますと、検索サービスで「ピザにチーズがくっつかない」と尋ねたところ、「ソースに無害の接着剤を使うこと」を勧めたり、ガソリンでパスタの調理が早くなるかと質問したところ、「早くはならないが、ガソリンによって辛い味付けになる」と回答したということです。また、実際はキリスト教徒であるアメリカのオバマ元大統領が、イスラム教

ardarim 2024/05/26

リンク

日本のアニメなどから収集したデータセット「Sakuga-42M」　国際研究チームが公開　「学術研究でのみ使用可能」【更新済み】

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。 X：＠shiropen2 【更新履歴：2024年5月24日午後1時50分更新　同時刻時点で論文は取り下げられ、GitHubのリポジトリ非公開となったことを確認しました。カナダのアルバータ大学や中国の四川音楽学院に所属する研究者らが発表した論文「Sakuga-42M Dataset: Scaling Up Cartoon Research」は、AIモデルのトレーニング用に作成したアニメ動画データセットを提案した研究報告である。 Sakuga-42Mは、GitHubにおいてリポジトリが公開されており、学術研究の目的でのみ使用可能。また、データセット内の画像やビデオの著

ardarim 2024/05/24

「大規模なアニメーションデータセットがこれまで存在しなかったこと」には理由があったというだけのことだったな。誰も思いつかなかったのではなく著作権の問題で誰もやらなかった

リンク

Microsoft、「AI Toolkit for VS Code」を発表／既存の「Windows AI Studio」をクロスプラットフォーム拡充、発展させる

ardarim 2024/05/22

人工知能

リンク

最近ローカルLLMがアツいらしい

最近、ローカルLLMがアツくなっているという話をtwitterでチラホラ見かける。ローカルLLMって何じゃ？というと、オープンに公開されているモデルのウエイトをDLしてきて手元のPC上で推論させる事である。オープンなAIモデルとは逆の存在として、モデルがDLできないクローズなAIモデルもある。 OpenAIやAnthropicのような最先端AI企業のクローズなAIモデルに比べて、オープンに公開されているオープンなAIモデルの性能は今でもかなり後れを取っている。だから去年の間はあくまでAIの本命はChatGPTのようなクローズモデルであって、オープンなAIモデルなんて眼中にありませんみたいな風潮が無くはなかった。だが最近は風向きが少々変わってきている。 GPTのAPI高い問題＆ OpenAIがAIベンチャー皆殺しにしてしまう問題まず「結局GPTのAPIを叩いてサービス運営して成功し

ardarim 2024/05/20

どんなに高尚でテクニカルな議論でも最後にはエロチャに収斂してしまう、人間の性

人工知能

リンク

GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→｢ついにコーダーが恐怖を感じる時が来たか｣

kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません．思いついたことをつぶやきます．人生を楽しく生きよう（New!） kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

ardarim 2024/05/14

これが無料か…やばいな。まああくまで簡単なものに留まるんだろうけど、それでもここまで理解して出力できるのすごい

人工知能

リンク

GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記：嘘でした。Gemini 1.5 proもすごいです。

昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

ardarim 2024/05/14

結果を載せてるだけでどこがどうすごいのか比較してるわけじゃないので何がすごいのか分からんかった

人工知能

リンク

「GPT-4o」発表　頭一つ抜けた性能をChatGPT無料版にも展開　音声と視覚を備えて“自然な対話”可能に【追記済】

米OpenAIは5月13日（米国時間）、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す

ardarim 2024/05/14

リンク

まるで“いけない話ができるChatGPT”　ローカルAI「Command R+」の爆発的な可能性 (1/5)

筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子（あすきこ）さん」 PCローカル環境で動作する大規模言語モデル（LLM）「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT（GPT-4）と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

ardarim 2024/05/13

人工知能

リンク

画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」

画像生成AI関連の著名な開発者、lllyasviel（イリヤスフィール）氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light（Imposing Consistent Light）」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像（人物やオブジェクトなど）を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。現在、「テキスト条件付きリライティングモデル（text-conditioned relighting model）」と「背景条件付きモデル（background-conditioned model）」の2種類がGitHubで公開されており自由に試すことができる。なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

ardarim 2024/05/10

リンク

ファミレスで隣の席のカップルが喧嘩を始めて女がスマホのLINEの画面見せて彼氏に詰問。「彼氏の浮気か？」と思ったが違って。「ChatGPTに書かせた奴、そのまま貼ったの？」

やねうらお @yaneuraoh BM98,BMSの生みの親 / ヒルズにオフィスのある某社CTO / プログラミング歴45年(5歳から) / 将棋ソフトやねうら王開発者yaneuraou.yaneu.com / 音楽理論ブログmusic.yaneu.com / 天才(らしい) s.nikkei.com/3aWHJj0 d.hatena.ne.jp/yaneurao/ やねうらお @yaneuraoh いまファミレスにいるんだけど隣の席のカップルが喧嘩をおっぱじめた。女がスマホのLINEの画面見せて「これは何？」と彼氏に詰問している。私は彼氏の浮気がバレたのかな？と思ったのだが、違ったようで、その彼氏とのトーク画面らしかった。男「これが何か？」 1/n 2024-05-06 19:10:23 やねうらお @yaneuraoh 女「これ前回のデートのあと、あんたが送ってきたお礼の文章。

ardarim 2024/05/07

リンク

MetaのLlama 3を日本語でさらに学習したAIモデル、rinnaが公開

ardarim 2024/05/07

人工知能

リンク

2023年、AIの影響で『絵に求められる事』が激変してきている話。｜さいとう　なおき｜pixivFANBOX

クリエイターの創作活動を支えるファンコミュニティ「pixiv FANBOX」

ardarim 2024/05/05

リンク

ゴミ出しの問い合わせにＡＩが架空の部署案内、正答率は目標に届かず「市民向けには時期尚早」

【読売新聞】　瀬戸内海に面し、製造業や農業が盛んな香川県三豊（みとよ）市。環境衛生課課長補佐の岡崎英司さん（５１）は昨年１１月、役所のパソコン画面を見て、嘆息した。視線の先には、実証実験中の対話型ＡＩ（人工知能）サービス

ardarim 2024/05/01

なんかだいぶ前に読んだ既視感があるが… https://newsdig.tbs.co.jp/articles/-/892974 読売、周回遅れすぎない？

リンク

漫画家の絵柄、AIでそっくり再現「ピュアモデルAI」ができたワケ (1/3)

発表当初は、画像生成AIに詳しいXユーザーのあいだで「画像生成AI『Stable Diffusion』で、追加学習モデル『LoRA』を使っているだけでは」という疑問の声も出ていたが、エンドルフィンは4月5日にプレスリリースを出し、「私たちが提供しているサービスは、公開されている汎用モデルを活用した生成AIとは一線を画しています」として、画像の生成までに独自のプロセスを踏んでいる旨を説明している。話題の「ピュアモデルAI」ができた経緯や、その技術的背景について、連載「メタバース・プレゼンス」を執筆している新清士氏とアスキー編集部で、エンドルフィンの代表と、サービス開発元のスーパーエンジンのCEOに話を聞いた。生成AIは「アナログからデジタル」の変化と同じ ──　最初にそれぞれの会社について教えてください。ジェームズ　キム・ドンジュン　2022年下半期ごろから、生成AIに関心をもって、