「どの生成AIに課金すべき?」を見極めるためにAI検索サービスに課金するという方法(1/2 ページ) 今年前半の生成AI各社のアップデートが一通り出そろいました。米OpenAIの「GPT-4o」、米Googleの「Gemini Ultra」。そして、少し前の3月にアップデートされていた米Anthropicの「Claude3 Opus」が、今の生成AIの“御三家”といったところでしょうか。 生成AIが通常のWebサービスなどと比較して、膨大なコンピューティングパワーを必要とし、そのためとてもコストが掛かることは、すでに知られている通りです。そのためもあってか、この手のサービスとしては、かなり初期段階から有料版が設定されてきました。そして、アップデートが進む中、無料版と有料版にかなりの差が付いてきています。
「正直、たくさん悩みました」――人気声優の梶裕貴さんが、自身の声で自由にしゃべらせることができる音声合成ソフト「CeVIO AI 梵そよぎ(そよぎそよぎ) トークボイス」を製品化すると発表した。5月29日午後9時から、クラウドファンディングサイト「CAMPFIRE」で受注をスタートする。 ここ最近、AIを使って人気声優の声などを無断で再現したコンテンツが問題になっており(関連記事)、梶さんも頭を悩ませてきたという。だが「AIと敵対するのではなく、共存すべき」と結論づけ、「あえて私の声を持つ『梵そよぎ』を解禁することで、"正しい音声AIの在り方"を証明できるのではないか」と考えて開発を決断したという。 CeVIO AIは、ソニー・ミュージックエンターテインメントや名古屋工業大学発ベンチャーのテクノスピーチなど、複数の企業が参加する音声合成AIプロジェクト。 「CeVIO AI 梵そよぎ」は、
OpenAIは5月13日(米国時間)、オンラインでSpring Updateイベントを開催。その中で、フラグシップとなる大規模言語モデル「GPT-4o」を発表しました。 APIでの提供も行い、現行最新モデルのGPT-4 Turboと比べて2倍高速、価格は50%安価に、レートリミットは5倍に拡張されています。 GPT-4oはオーディオ、ビジョンを統合したマルチモーダルLLMで、強力なボイスモードを搭載。イベントで行ったライブデモでは音声で感情豊かに澱みなく回答。ユーザーからの割り込みにも柔軟に対応し、歌いながら答えたり、モバイルChatGPTアプリで英語とイタリア語が混在した会話の通訳をしたり、MacBookで動いているデスクトップ版ChatGPTアプリで画面内のコードやグラフを読み取って分析したりしてみせました。 ▲iPhone版ChatGPTアプリでカメラに映した手書きの数式を見せながら
Googleは4月30日(現地時間)、生成AIサービス Geminiモバイルアプリの提供地域を拡大すると発表しました。 日本でもAndroidではGoogle Playストアからダウンロードが可能。iOSの場合は専用アプリはなく、Googleアプリからのアクセスとなります。 発表は4月30日でしたが、実際には1週間ほど前にはGoogle Playストアからダウンロードできていました。また、一部のAndroid端末では、2月末からGoogleアシスタントを置き換える形でGeminiが利用可能になっていました。 なお、アプリ版でも初回起動時にGoogleアシスタントからの切り替えを求められるので、アプリでGeminiを利用し、音声アシスタントとしてGoogleアシスタントを使い続けるということはできないようです。
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 米国空軍テストパイロットスクールと国防高等研究計画局は(DARPA)、昨年2月にAIによる自律飛行を実現したX-62A可変飛行安定性試験機(VISTA)を用い、有人のF-16戦闘機との模擬空中戦に成功したと発表しました。 DARPAの空中戦革新(Air Combat Evolution:ACE)プログラムの一環として、人工知能アルゴリズムを搭載したX-62A VISTAは、2023年9月に行われた飛行試験で「大規模な機首対機交戦」による防御と攻撃の両方の機動を試し、有人パイロットが操るF-16に対し時速1200マイル(約1900km)で2000フィート(約610m)の距離にまで接近したと説明。X-62A VI
米OpenAIの「ChatGPT」やGoogleの「Gemini」など、主要生成AIの弱点や脆弱性が次々に発覚している。企業や個人の日常生活に浸透している生成AIが悪用されれば、社外秘情報や個人情報の流出を招いたり、悪用防止対策がかわされて偽情報の作成に利用されたりする恐れもある。 イスラエルのベングリオン大学の研究チームは、生成AIとユーザーの間に割り込んでデータパケットを傍受し、AIの回答内容を高い精度で復元する攻撃に成功したと発表した。この攻撃は、生成AIがユーザーの質問に回答する際のデータ処理に存在する脆弱性を突いている。 (関連記事:他人がGPT-4とやりとりしたテキストを盗む攻撃 成功率50%以上 イスラエルの研究者らが発表) ChatGPTなどの生成AIがユーザーの指示や質問に対して答えを返す際は、文章を単語や文字ごとにトークン化し、個々のトークンを連続的にユーザーに送信して
日本マイクロソフトは2月20日、生成AIに関する企業向けイベント「Microsoft AI Tour」を東京ビッグサイトで開催した。基調講演には、日本マイクロソフトの津坂美樹社長らが登壇。基調講演の中で津坂社長は「AIを語る段階を卒業し、スケールさせ、フル活用の1年になる」と話し、2024年が生成AIの飛躍の年となることを予告した。 「1ドルのAI投資に、3.5ドルのリターン」 生成AIに注力するMicrosoft その自信を裏付けるのは、生成AIが生み出すという莫大な経済効果だ。経済産業省が20年に公開した報告書では、中小企業がAIを活用すると、25年に11兆円のGDP押し上げ効果があり、日本全体で34兆円の経済効果があると試算している。Microsoftの独自試算でも、1ドルのAI投資に3.5ドルのリターンが見込めると算出している。 Microsoftでは、AIアシスタント「Micro
Googleの生成AIであるGeminiが、多様性に配慮するあまり「1943年のドイツ軍兵士の画像を作って」に対してナチスドイツ風軍装の黒人男性やアジア人女性などを生成してしまい、Googleは歴史的に不正確だったと認める声明を発表するできごとがありました。 Googleが全力でプッシュする生成AIのGemini は文章での会話だけでなく、ユーザーが指示した内容の画像を生成する機能も備えています。 問題になったのは、特定の国や地域、歴史的文脈を指示して人物の画像を生成させると、史実を無視した、あるいは反映しない「多様な」人物を描く傾向が見つかったこと。 たとえば1943年、つまりナチスドイツ時代のドイツ兵士の画像というリクエストに対して、4枚の候補のうち1枚をドイツの鉄十字を身に着けた黒人男性、もう一枚をアジア人女性にしてしまった例があります。 また別の例では、米国のいわゆるファウンディン
米Microsoftは2月20日(現地時間)、大規模言語モデル「GPT-4」などのAPIを同社のクラウド上で使える「Azure OpenAI Service」の外部データ連携機能「On Your Data」を正式リリースした。これまではパブリックプレビュー版として提供していた。 On Your Dataはいわゆる「RAG」(大規模言語モデルに外部データベースの情報を参照させ、機密情報を基にした回答などを可能にする仕組み)の構築に向けた機能。ローカルやAzure上のストレージに保管するテキストファイルやPDF、PowerPointファイルを、GUIの操作でGPT-4などに参照させられる。 参照できるのはクラウド型検索サービス「Azure Cognitive Search」のインデックス(検索対象)にインポートしたデータや、Azureのストレージ「Blob Storage」に格納したデータなど
また、Gemmaの事前トレーニング済みモデルでは、学習データから特定の個人情報やその他の機密データを除外していると安全性もアピール。開発者や研究者向けに、安全で責任あるAIアプリケーションを構築できるというツールキット「Responsible Generative AI Toolkit」も併せて公開している。 関連記事 Google、“現行最強”の生成AI発表 月2900円で利用可 チャットAIサービスはBard→Geminiに刷新 米Googleは2月8日(現地時間)、「現行最強」をうたう生成AI「Gemini Advanced」を発表した。すでにサービスを提供開始しており、月額2900円で利用可能。2カ月間の無料試用期間も用意する。 Google、「Gemini 1.5 Pro」限定リリース コンテキストウィンドウは100万トークン Googleは、生成AIの次世代モデル「Gemini
米OpenAIは2月15日(現地時間)、テキストプロンプトから最長1分の動画を生成するAIモデル「Sora」を発表した。一部のユーザーに公開し、フィードバックに基づいて改善していく計画。 SoraのWebページ(リンクは記事末)は「Soraは、テキストの指示から現実的で想像力豊かなシーンを作成できるAIモデルだ」と謳っている。このページには多数の動画が掲載されているが、すべてSoraが生成し、修正していないものという。 複数のキャラクター、特定の種類のモーションなどを含む複雑なシーンを生成できるとしている。ユーザーがプロンプトで何を要求したかだけでなく、物理的な世界で実際にどのように存在するかも理解するという。 例として挙げられた動画の1つは、「スタイリッシュな女性が、暖かく輝くネオンとデジタルサイネージで満たされた東京の通りを歩いている。彼女は黒い革のジャケット、赤いロングドレス、黒いブ
メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。
講義資料は特設ページからダウンロード可能で、全7講義分のパワーポイントを無料で取得できる。内容はLLMの概要から、日本でのLLMの開発状況、Transformerと事前学習の仕組み、ファインチューニングなど。 関連記事 東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」 東京大学松尾研究室は、大規模言語モデル(LLM)の研究者や開発エンジニアを募集するとX(旧Twitter)で発表した。2024年、LLMの研究をさらに加速させるためチームを拡大するという。 ChatGPTでの業務効率化を“断念”──正答率94%でも「ごみ出し案内」をAIに託せなかったワケ 三豊市と松尾研の半年間 「ごみ出し案内」業務にはChatGPTを“活用しない”と決断──生成AIを使った業務効率化を検証してきた、香川県三豊市がそんな発表をした。実証実験には松尾研も協力したが、思
Googleさん、5月のGoogle I/Oで予告していた新生成AIモデル「Gemini」のバージョン1.0をぎりぎり年内にリリースしましたね。問題が多いから年内リリースは無理そうという噂もありましたが、とりあえずちっさいモデル(ProとNano)だけぎりぎり年内に出して面目を保った感じです。 本命でマルチモーダルな最大サイズの「Gemini Ultra」は来年に持ち越し。安全性のチェックと強化学習に時間をかけているそうです。 このUltraのデモ動画がすごすぎて話題になっていますが、動画の概要説明に「For the purposes of this demo, latency has been reduced and Gemini outputs have been shortened for brevity」(このデモでは、簡潔にするためにレイテンシが短縮され、Geminiの出力が短縮
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く