サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
猫
natalie.mu
「テクノロジー」「平等」「制作のジレンマ」が3つの軸 ──なぜAI歌声合成ソフトでEPを制作したんですか? EPのリード曲「I CAN FEEL IT」が「REFLECTION」を作ってる段階で70パーぐらいまではできていたんです。オケだけですけどね。そこに自分のボーカルを乗せてみたけど「なんかこれじゃない」と感じたので、そのまま放置していて。そんなときにSynthesizer Vという歌声合成ソフトがリリースされたんです。これをそのまま使うといまいちハマらないけど、フラットな感じのボーカルが入った拡張ボイスのバンクを入れてみたらいい感じで。 ──Synthesizer Vが未完成だった「I CAN FEEL IT」にハマったと。 そう。このフラットなボーカルは熱い歌詞と相性がいいと思ったんですよ。ホットなものをホットなまま出すのは自分の感覚にそぐわないけど、Synthesizer Vは「
codezine.jp
「GitHub Copilot」は、プログラムのコーディングをさまざまな機能で支援してくれるAIツールです。本連載ではGitHub Copilotのさまざまな機能や活用例を紹介していきます。初回となる今回は、GitHub Copilotの概要とともに、実際に使い始めるまでの手順を説明し、簡単な例でGitHub Copilotを体験します。 はじめに 近年、OpenAIの「ChatGPT」やMicrosoftの「Microsoft Copilot」、Googleの「Gemini」といった、さまざまなAIツールが利用できるようになっています。これらのAIツールは、人間の自然言語を理解し、質問への回答、画像や文章の生成、タスクの実行など、さまざまな機能で人間の作業を支援します。 図1 AIツールの利用例(Windows 11のMicrosoft Copilot) そんな中でも今回紹介する「Git
www.wwdjapan.com
東証プライムの通販大手スクロール子会社のスクロールインターナショナルは、生成AIを使ったアパレルデザイン生成サービス「ライトチェーン(LIGHTCHAIN)」が、ユーザーを急拡大している。自社のデザイナー・パタンナーでも簡単に使えるよう使い勝手を磨きながら、技術は中国有数のベンチャー企業と組んだ。繊維商社やOEM会社、アパレル企業、小売チェーンなどをターゲットに、数年内にスタンダートなサービスへと普及させる。 「ライトチェーン」は、デザイン生成やスタイル変更、生地・柄変更、ディテール変更、ボタンやレースなどの副資材の追加・変更が数クリックでできるサービス。ユーザーは自社のアーカイブ写真データを読み込ませることで、AIに特徴を覚えさせ、生成したいアイテムの写真などを読み込ませることで、上記のようなデザイン生成や変更を数クリックでできるようになる。月々の使用料を支払い、ブラウザ上でログインして
forest.watch.impress.co.jp
zenn.dev/mizchi
LangChain なんか使わなくてもシュッと作れたので記事にしておく。 RAG とは 生成AIに検索能力をもたせるやつ。 要は検索機能をこちらで提供してやって、AIにそれを読ませる。 AnthropicAI Tool OpenAI でいう Function Calling JSONSchema で関数シグネチャを与えると、それを使うDSLを生成する。実際の関数は自分で実装して、AI が生成した引数(JSONSchema に従う)を渡す。 TypeScript の Mapped Types でツールの実装部分に型をつける簡単なラッパーを書いた。 RAG の CLI を作る Google検索をするAPIを実装 Google Custom Engine API を使った 本文要約をするAPIを実装 Mozilla の実装を使った 与えられた URL を fetch して、その本文部分を抽出する
gigazine.net
大量のデータを用いた学習のおかげで人間の言語を処理できる、人工知能モデルの一種・大規模言語モデル(LLM)は、いろいろなことに答えてくれるものの、違法な内容や暴力的な内容の回答は出力されないように設定されていて答えをくれません。しかしそれ以外にも答えることができない種類の質問が存在します。どういった質問に答えることができないのか、それはなぜなのか、AIの話題を多く扱うサイト・Mind Prisonが説明しています。 The question that no LLM can answer and why it is important https://www.mindprison.cc/p/the-question-that-no-llm-can-answer 「LLMが答えることができない質問」としてMind Prisonが例に挙げたのは、「ドラマ『Seer Gilligan(ギリガン君S
speakerdeck.com/tomo1215
共創のための地域基盤としての非公式組織の形成 / Informal community as an infrastructure for co-creation
speakerdeck.com/joisino
グラフニューラルネットワーク - Forkwell Library #50 https://forkwell.connpass.com/event/315577/ での講演スライドです。 サポートサイト:https://github.com/joisino/gnnbook グラフニューラルネットワーク(機械学習プロフェッショナルシリーズ)好評発売中!:https://www.amazon.co.jp/d/4065347823 連絡先: @joisino_ (Twitter) / https://joisino.net/
megalodon.jp
https://note.com:443/vips_kintone/n/n0e17a70a4ee7 - 2024年4月26日 11:31 - ウェブ魚拓
クリエイターの権利団体であるSociety of Authors (SoA)が、会員を含めたクリエイターを対象とした調査を2024年1月に行い、イラストレーターの4分の1以上、翻訳家の3分の1以上が生成AIによって仕事を失ったことがわかったと報告しています。 SoA survey reveals a third of translators and quarter of illustrators losing work to AI - The Society of Authors https://www2.societyofauthors.org/2024/04/11/soa-survey-reveals-a-third-of-translators-and-quarter-of-illustrators-losing-work-to-ai/ SoAは2024年1月に、1万2500人の会員
pc.watch.impress.co.jp
logmi.jp
海外版のピザ屋のデモ 森正弥氏:海外版のピザ屋のデモを流せればと思います。英語がちょっと流れますが、こんな感じです。 ピザ屋に店員のAIアバターがいて、お客さんが来て……お客さんがだいぶぶっきらぼうですけど(笑)、答えていくのをハンドリングして、最後はペイメントまでやるという感じでした。シナリオは一定はありますが、これは裏がLLMで、ここではNVIDIAのNeMoを使って会話をやっているので、シナリオじゃないアクションにももちろん普通に対応できます。 例えばいきなり「アジャイルって知っている?」と聞いたらきちんと答えてくれます。NeMoは英語とスペイン語がすごく得意なので、このデモは英語のデモになっていますが、日本語でも動きます。 あと、単にこれは単なるマイクロサービスのマッシュアップなので、23個ぐらいのマイクロサービスが立ち上がっていて、そんなに立ち上げるのかと思いながらやっています。
www.yomiuri.co.jp
【読売新聞】 高額報酬をうたって犯罪行為に巻き込む「闇バイト」を防ごうと、福井県警は仁愛大の安彦智史准教授(情報学)と、SNS上で実行役などを募る投稿をAI(人工知能)が自動で検知するシステムを共同開発した。県警は2月に本格運用を開
クラウドベースのデータウェアハウスサービスを展開する企業のSnowflakeが、トップレベルのエンタープライズ向け大規模言語モデル(LLM)として「Snowflake Arctic」をリリースしました。Apacheライセンス バージョン2.0で提供されるオープンなモデルとなっており、無料で商用利用も可能です。 Snowflake Arctic - LLM for Enterprise AI https://www.snowflake.com/blog/arctic-open-efficient-foundation-language-models-snowflake/ Snowflakeの調査では、企業ユーザーはAIを使用して主にデータ支援やコード支援、検索拡張生成(RAG)を行うチャットボットを作成したい場合が多いとのこと。そこで、Snowflakeは「コーディング能力」「SQL生成能力
techtekt.persol-career.co.jp
データバージョンの管理とは? データバージョンの管理とは、バイナリデータのバージョンを管理することを指します。データバージョンの管理は、Git 等でのコードのバージョン管理をバイナリデータに拡張しています。実験の再現性を高められるメリットがあります。 DVC とは? データのバージョンを管理する機能をもつオープンソースソフトウェアです。データのハッシュをテキストファイルで保持し git でバージョン管理します。また、yaml ファイルで実行パイプラインを定義して監視対象データが更新された際にハッシュを更新することで、新しいハッシュ値を含んだデータをバージョン管理します。更新されたデータファイルはキャッシュディレクトリに保存され、必要なタイミングで自動的に復元されます。 データのリモートリポジトリを定義することで、データ一式を簡単なコマンド操作で S3 等へ push / pull すること
xtech.nikkei.com
プログラミング分野でよく話題になるのが「どのプログラミング言語が優れているか」というテーマだ。個人的には「どんな言語を使っていようとプログラミングの本質は変わらないので、不毛な議論ではないか」と感じることが多い。それぞれの案件に適した言語を使えばいいだけではないかと思ってしまう。 もっとも、これは日常的にプログラミングをしていない部外者の意見かもしれない。日々のソフトウエア開発業務では、プログラミング言語は最も重要なツールの1つだ。どんなツールを使うかが開発効率に直結することは大いにあり得る。 例えていえば、コード入力に使うキーボードのようなものだろうか。どんなキーボードでも気にしないエンジニアがいる一方で、キーボードのタッチに異様にこだわるエンジニアもいる。後者にとって、特定のキーボードを利用できるかどうかは開発効率を左右する死活問題だ。プログラミング言語にも、それに似た面があるのかもし
nlab.itmedia.co.jp
アイドルグループ「おちゃメンタル☆パーティー」の下谷あゆさんが4月25日、Xを更新。電車移動中の出来事を明かしました。 下谷あゆさん(画像は下谷あゆInstagramから) Xのプロフィールでは身長174センチと公表している、高身長な下谷さん。 電車の女性専用車両に乗っていた際に持ち物を落としてしまい、他の乗客が拾ってくれたので「ありがとうございます」と感謝を伝えたところ、その相手から「ここは女性専用車両です!!! おりろっ!!!!」と、なぜか怒られてしまったと振り返りました。 「なんなら今日ここ最近で1番女の子っぽいと思っててんけどなぁ、、、、声か、、、声が低いんか、、」と切ない気持ちをつづった下谷さんに、SNSでは「そんなこと言われるんですね」「大変だったね、、、」「理不尽すぎるな………辛かったな……」「その言ってきた人、失礼すぎない?」など反響の声があがりました。 下谷さんのSNS投
qiita.com/Cartelet
はじめに 先日以下の記事が話題となり、とてもワクワクしたので自分も実装して色々実験してみました。 実装するうちに理解が深まったので一度、 誤差拡散法の元ネタ紹介から 数式の解説、 ED法の弱点、 行列計算を使用した実装と簡単なテスト結果、 実装上の工夫 までまとめてみたいと思います。 誤差拡散(Error Diffusion)法 もともとは画像の2値化において失われる情報を周囲のピクセルで補うことで、遠目に元の画像の濃淡が残っているように見せる技術(ハーフトーン処理の一種)です。 Error diffusion -Wikipedia(英語版) 左の画像をちょうど半分の明るさをしきい値として2値化すると中央の画像のようになりますが、誤差拡散法を適用すると2値化後も右の画像のようにある程度濃淡を保存・表現できます。 誤差拡散法(画像処理)のサンプルコード コメントアウト箇所はFloyd, St
note.com/erukiti
LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由という記事を書きました。 mutaguchiさんのツイートを見て、LLMプロダクトの開発とはどういうものなのかを知らない人も多いのかなと気づいたので、そこらへんを記事として書いてみます。 https://t.co/4WvjuuoGnC 「LLMプロダクト開発者がMac Studioを買ってローカルLLMを触るべき理由」の記事のはてブコメント見てたんだけど、ほとんど理解されてなかったのが興味深い。 ・プロプライエタリなLLMでは、ランニングコストが嵩み、これを利用したサービスは成立しづらい… — mutaguchi (@mutaguchi) April 24, 2024 商用LLM APIとローカルLLMって使い方が全然違う気がしてる。 商用LLM APIって、機微情報を送らないこと、規約違反テキストを送らないこ
gadget.phileweb.com
テクノロジー アップルはこれまでもプライバシーを重視してきました アップルは巨大IT企業で唯一、自社AI訓練の著作権問題がない? Image:Framesira/Shutterstock.com 2月に行われたアップルの今年最初の決算報告で、ティム・クックCEOは「iOS 18」に触れなかった。その一方で、AIについては2度も言及。同氏は発言の中でアップルがAIに「膨大な時間と労力」を費やしているとし、その詳細は「今年のどこかで」発表されると述べた。その機会はアップルが毎年開催している世界開発者会議、WWDCになるはずだ。 そしてアップルは、生成AIを合法的に訓練する唯一の巨大テクノロジー企業かもしれない。 大規模言語モデル(LLM)を使用した生成AIチャットボットは、OpenAIの「ChatGPT」、マイクロソフトの「Copilot」、Googleの「Gemini」などが次々と話題になっ
次のページ
AI・機械学習の人気エントリー
ITの新着エントリー
セキュリティ技術の新着エントリー
はてなブログ(テクノロジー)の新着エントリー
プログラミングの新着エントリー
エンジニアの新着エントリー
このページを最初にブックマークしてみませんか?
『AI・機械学習』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く