タグ

ブックマーク / xtech.nikkei.com (112)

  • Transformerを性能で凌駕、AIの新たな可能性を拓く5月の注目論文

    生成AI人工知能)を含む最新のAI研究動向を知るため、世界中の研究者やエンジニアが参照しているのが、論文速報サイト「arXiv(アーカイブ)」である。米OpenAI(オープンAI)や米Googleグーグル)などAI開発を主導するIT企業の多くが、研究成果をarXivに競って投稿している。 そんなarXivの投稿論文から、2024年5月(1日~31日)にSNSのX(旧Twitter)で多く言及されたAI分野の注目論文を紹介する。調査には米Meltwater(メルトウォーター)のSNS分析ツールを利用した。対象はXの全世界のオリジナル投稿、コメント、再投稿、引用投稿である。調査は、日経BPが2024年1月に新設したAI・データラボの活動の一環として実施した。 Transformer並みの拡張性をLSTMで実現 5月に最も多く言及された論文は、オーストリアの研究チームが発表した「xLSTM:

    Transformerを性能で凌駕、AIの新たな可能性を拓く5月の注目論文
    misshiki
    misshiki 2024/06/10
    “「xLSTM: Extended Long Short-Term Memory」。深層学習ベースの言語モデルのアーキテクチャーであるLSTMを改良し、数十億パラメーターの言語モデルにおいてTransformer並みかそれ以上の拡張性を持たせたという。”
  • 胎動する「ポストGPU」、NVIDIAのボトルネック狙う米スタートアップの最終兵器

    快進撃を続ける米NVIDIA(エヌビディア)。AI人工知能)半導体であるGPU(画像処理半導体)の行方を占う連載の3回目は、「ポストGPU」と呼ばれる新型のAI向け半導体を取り上げる。この領域はスタートアップを中心に様々な技術が登場している。GPUのボトルネックを狙う最終兵器とは。 ポストGPUの特徴に、今後のニーズを見据えてAIの学習ではなく推論を専用とするスタートアップが多いことが挙げられる。例えば米d-Matrix(dマトリックス)は異なるチップを組み合わせる「チップレット」技術を採用し、最先端GPUの40倍のメモリー帯域幅を実現した。 米ハーバード大学を中退した21歳のコンビが起業した米Etched.ai(エッチドAI)や、米Googleグーグル)で機械学習向けチップ「TPU(Tensor Processing Unit)」を担当していたエンジニアが創業した米Groq(グロック

    胎動する「ポストGPU」、NVIDIAのボトルネック狙う米スタートアップの最終兵器
    misshiki
    misshiki 2024/06/07
    “つまり、プログラムはデータフロー型なのに計算機はノイマン型というチグハグな状態がAIの現状だ。このミスマッチによってGPUは「無理」をしている。”
  • 生成AIを賢くするには「メガプロンプト」がお勧め、ファインチューニングは有害?

    生成AI人工知能)の活用においては、大規模言語モデル(LLM)に与えるプロンプト(指示文)の工夫が重要だ。最新の研究で、プロンプトは長く詳細であるほど良好な結果が得られることが分かっており「メガプロンプト(巨大プロンプト)」という言葉すら登場しているほどだ。 LLMに与えるプロンプトというと、米OpenAI(オープンAI)が提供するChatGPTのようなチャットボットの入力画面に打ち込む数行のテキストを想像しがちだ。しかし先進的なAI研究者は最近、紙に印刷すると1~2ページにも及ぶような、とても長いプロンプトの開発に取り組んでいるのだという。 「私たちのチームではそれをメガプロンプトと呼んでいる」。ディープラーニング(深層学習)の著名研究者で、AI教育サービスを手掛ける米DeepLearning.AI(ディープラーニングドットAI)の創業者であるAndrew Ng(アンドリュー・ウン)氏

    生成AIを賢くするには「メガプロンプト」がお勧め、ファインチューニングは有害?
    misshiki
    misshiki 2024/06/03
    “最新の研究で、プロンプトは長く詳細であるほど良好な結果が得られることが分かっており「メガプロンプト(巨大プロンプト)」という言葉すら登場している”
  • もはやデジタル後進国ではない、意外と進んでいる日本の生成AI活用

    生成AI人工知能)の活用で、どうやら日は欧米などの海外から後れを取っているわけではなさそうだ。「むしろ私の感触では、日の方が進んでいるかもしれない」――。2024年3月、生成AIに関するイベントでそう話した講演者の発言に、招聘(しょうへい)した筆者自身が少し驚いた。デジタル活用の不十分さがよく指摘される日にあって、こと生成AI活用に関しては先進的だというのだ。 たしかに日の積極的な取り組みを示す資料がある。PwC Japanグループは2024年3月19日、「第27回CEO意識調査」に基づく生成AI活用の現状と日の状況分析を公表した。その関連資料には、「日は生成AIの業務活用において主要各国に先行。背景にあるのは事業継続への危機感、サイロ化文化と生成AIとの親和性の高さ」と記されている。 毎年恒例のCEO(最高経営責任者)調査の中で、自社の業務に生成AIがどれだけ受け入れられて

    もはやデジタル後進国ではない、意外と進んでいる日本の生成AI活用
  • 複数のLLMを自動的に融合して新LLMを開発、Sakana AIが新手法

    AI人工知能)関連のスタートアップであるSakana AI(サカナAI)は2024年3月21日、「世界初」(同社)となる大規模言語モデル(LLM)の自動開発技術を発表した。既存の複数のLLMを融合(マージ)して新しいLLMを開発するもので、LLMの開発を短期間・低コストで進められる可能性がある。 Sakana AIはこの手法を使い「日語のLLM」と「数学に特化した英語のLLM」を融合することで「日語で数学の問題を解けるLLM」を開発した。通常のLLM開発と異なり大量のデータを使ったトレーニング(訓練)は行わないため、開発に必要となる計算リソースは「(既存のLLM開発と比較すると)無視可能なレベルだ。開発も1日以内に完了した」(Sakana AIの園田紘章氏)とする。同社にはNTTグループやKDDI、ソニーグループなどが出資している。 今回発表した技術は「進化的モデルマージ」と呼ぶもの

    複数のLLMを自動的に融合して新LLMを開発、Sakana AIが新手法
  • OpenAIのライバル、Cohere共同創業者が一押しするAI幻覚対策の切り札「Rerank」

    大規模言語モデル(LLM)の弱点であるハルシネーション(幻覚)への対策として、最も期待されているのはRAG(Retrieval-Augmented Generation、検索拡張生成)だ。RAGに強みを持つカナダのスタートアップ、Cohere(コーヒア)のNick Frosst(ニック・フロスト)共同創業者は、RAGの高度化に「Rerank(再順位付け)」という技術が欠かせないと指摘する。 RAGはLLMに対して、事前学習した知識だけでなく外部の知識情報も参照させてテキストを生成させる手法だ。RAGを活用すれば、企業の内部情報に基づいた回答をLLMに生成させることも可能であるため、LLMがデタラメな回答を出力するハルシネーションへの対策として有望視されている。 LLMと検索を組み合わせるのが「RAG」 RAGは「検索拡張生成」というネーミングが示すとおり、LLMに参照させる知識情報の選択に

    OpenAIのライバル、Cohere共同創業者が一押しするAI幻覚対策の切り札「Rerank」
    misshiki
    misshiki 2024/03/22
    “Cohere(コーヒア)のNick Frosst(ニック・フロスト)共同創業者は、RAGの高度化に「Rerank(再順位付け)」という技術が欠かせないと指摘する。”
  • ハルシネーションの根絶は無理筋、ファインチューニングへの過度な期待も禁物

    生成AI人工知能)を業務活用する際に、ユーザー企業がつまずきがちなポイントを指摘する特集。第2回は「ハルシネーションをなくすのは難しい」「生成AIを業務自動化に活用するのは難しい」「ファインチューニングは難しすぎる」の3つを取り上げよう。 その4: ハルシネーションをなくすのは難しい 生成AIが抱える課題として最も広く認識されているのはハルシネーション(幻覚)だろう。生成AIがもっともらしい嘘を回答する問題だ。しかし「ハルシネーションをなくすのは難しい」。それが第4のポイントだ。 まず「ハルシネーションを根絶しない限り、生成AIは業務で活用できない」と考えること自体が、生成AIの業務活用を難しくするということを明言しておこう。「ハルシネーションは完全な悪ではない。今の生成AIは前提としてハルシネーションが発生してしまう。しかしユーザーが生成AIの出力を咀嚼(そしゃく)して利用するなら、

    ハルシネーションの根絶は無理筋、ファインチューニングへの過度な期待も禁物
    misshiki
    misshiki 2024/03/05
    “ユーザーが生成AIの出力を咀嚼(そしゃく)して利用するなら、ハルシネーションは大きな問題にはならない”
  • Microsoft CopilotのAI実用度、使ってみて分かったこと

    今回は、ついに登場した米Microsoft(マイクロソフト)のOffice製品に対応するCopilotの実用度をチェックしていく。個人向けの「Copilot Pro」は月額3200円、ビジネス向けの「Microsoft Copilot for Microsoft 365」は月額3750円だ。 今回利用しているのは後者である。Officeに比べてもかなり高価といわざるを得ないだろう。僕は年間契約で4万5000円を支払ったので、その価値があるのか考えつつレビューしていきたい。 今回はWordとPowerPointの2を紹介する。この他にもOneNoteやTeams、Outlookなどに対応しており、Excelはまだプレビュー段階の英語版なので、正式版がリリースされたらまた取り上げたいと思う。 最大の特徴はOfficeアプリに組み込まれていて、シームレスに使えることだ。アップデートを有効にする

    Microsoft CopilotのAI実用度、使ってみて分かったこと
    misshiki
    misshiki 2024/02/21
    “OfficeのCopilotを使ってみたが、効率アップという意味では導入する価値は十分にある。”
  • 国産「小さいLLM」が2024年春に相次ぎ登場、NECとNTTが見いだした2つの勝ち筋

    国内大手ITベンダーが2024年、ついに大規模言語モデル(Large Language Models:LLM)サービスの提供を始める。NTTは2024年3月に「tsuzumi(つづみ)」を、NECは2024年春ごろに「cotomi(コトミ)」をそれぞれ提供する予定だ。さらにソフトバンクも2024年内にLLMを開発するとしている。 NTTNECが提供する国産LLMはいずれも、「大規模」言語モデルとはいえ米OpenAI(オープンAI)の「GPT」などに比べるとコンパクトにつくられている。実はこの規模を選んだことこそが、2社それぞれの見いだした勝ち筋でもある。果たして2社は「GPT1強」とも言える市場に変化を起こせるか。国内勢と海外勢の違いをひもときながら、2社の狙いを見ていこう。 「大規模」だけど「小さい」国産LLM これまでGPTをはじめとするTransformerベースのLLMは、パラメ

    国産「小さいLLM」が2024年春に相次ぎ登場、NECとNTTが見いだした2つの勝ち筋
    misshiki
    misshiki 2024/02/08
    小型化してオンプレミスで勝ちたいのともう一つは何かわらかない(有料)。
  • 距離の絶対値を取る「最小絶対値法」、なぜ機械学習であまり使わない?

    機械学習の最も基礎的な手法が最小二乗法だ。この特集では、Pythonで最小二乗法のプログラムを実装することで、その仕組みを学んでいく。 最小二乗法では、回帰式とデータ間の距離を二乗することでマイナスの値が出てこないようにしますが、「マイナスの値を出したくないのなら、距離の絶対値を取ってもよいのではないか」と思われた方もいるでしょう。というよりも、絶対値という概念を知っていれば、そう考える方が自然と言えるかもしれません。実は、距離の絶対値を取る「最小絶対値法」という手法があります。最小絶対値法による回帰は「ロバスト回帰」と呼ばれます。 回帰式とデータ間の距離を「誤差」と考えるとしましょう。その誤差の値が最も一般的な確率分布である“正規分布”になるときは、最小二乗法で良い結果が得られます。一方、「外れ値」があり、誤差が正規分布にならないときは、最小絶対値法の方が良い結果になることが多いようです

    距離の絶対値を取る「最小絶対値法」、なぜ機械学習であまり使わない?
  • 米Metaが1万人の追加レイオフ、5000人の採用も中止

    米Meta(メタ、旧Facebook)は米国時間2023年3月14日、1万人を追加でレイオフ(一時解雇)すると発表した。5000人の採用計画も中止する。同社は2022年11月に約1万1000人のレイオフを発表済み。景気減速で業績悪化が著しく、さらなるリストラに踏み切る。 マーク・ザッカーバーグCEO(最高経営責任者)が社員に宛てたメールで明らかにした。まず2023年3月15日に人事部門の採用チームの従業員にレイオフを通知する。その後、4月下旬に技術系、5月下旬に事務系の従業員にそれぞれ通知する予定だ。一部、米国外ではレイオフが年末までずれ込む見込み。今後数カ月の間に組織の縮小と優先順位の低いプロジェクトの中止といったリストラ計画も発表する。ザッカーバーグCEOは「避けて通ることはできない」とした。 同社の2022年10~12月期の売上高は前年同期比4.5%減の321億6500万ドル(約4兆

    米Metaが1万人の追加レイオフ、5000人の採用も中止
    misshiki
    misshiki 2024/01/22
    “景気減速で業績悪化が著しく、さらなるリストラに踏み切る。”
  • 機械学習の基礎の基礎、最小二乗法を学ぶ

    機械学習の最も基礎的な手法が最小二乗法だ。この特集では、Pythonで最小二乗法のプログラムを実装することで、その仕組みを学んでいく。 出典:日経ソフトウエア、2024年1月号 pp.6-21 「今から始める機械学習入門 Part1 基礎となる『最小二乗法』をマスターする」を改題、編集 記事は執筆時の情報に基づいており、現在では異なる場合があります。

    機械学習の基礎の基礎、最小二乗法を学ぶ
    misshiki
    misshiki 2024/01/18
    “機械学習の最も基礎的な手法が最小二乗法だ。この特集では、Pythonで最小二乗法のプログラムを実装することで、その仕組みを学んでいく。”
  • 実は実用性も十分、機械学習の基礎である「最小二乗法」を極める

    機械学習の最も基礎的な手法が最小二乗法だ。この特集では、Pythonで最小二乗法のプログラムを実装することで、その仕組みを学んでいく。 最小二乗法は機械学習の中でも、最も基礎的な手法です。基礎的でありながら実用性も十分に高いので、様々な「予測」に用いることができます。また、視覚化による理解がしやすいので、機械学習の初学者が最初に学ぶ手法として最適と言えます。 視覚的に理解する 最小二乗法は、図1の2枚のグラフで直感的にわかるでしょう。 図1の左にあるグラフには、データを表す青い点が複数あります。個々のデータは、(8, 820)や(36, 1720)といった2つの値の組み合わせです。2つの値の組み合わせなので、横軸と縦軸のグラフにデータを配置できます。 ここで、「すべてのデータの傾向をうまく反映する1の直線を描いてみよう」というのが最も基的な最小二乗法です。描いた直線が、図1の右にあるグ

    実は実用性も十分、機械学習の基礎である「最小二乗法」を極める
  • 投資集める「OpenAIのライバル」の実力、AnthropicとCohereは何がすごいのか

    要注目の海外生成AI人工知能)スタートアップ25選。今回紹介するのは、大規模言語モデル(LLM)をはじめとするAIモデルの開発企業だ。ChatGPTの生みの親である米OpenAI(オープンAI)が注目を集めるが、米巨大IT企業などは提携先としてそのライバルに熱視線を送る。米Anthropic(アンソロピック)やカナダのCohere(コーヒア)など有力企業6社の実力とは。 「私たちが何をしようとしているかを掘り下げるために、『パートナー』を紹介しよう」──。米国時間2023年11月28日、米Amazon Web Services(アマゾン・ウェブ・サービス、AWS)が開催した年次イベント「re:Invent」の基調講演で、同社のアダム・セリプスキーCEO(最高経営責任者)はこう言って、舞台袖からある人物を呼び入れた。 壇上に現れたのは、米Anthropic(アンソロピック)の共同創業者、ダ

    投資集める「OpenAIのライバル」の実力、AnthropicとCohereは何がすごいのか
  • LLMの根幹「Transformer」とは?並列処理に最適なワケ

    2017年にGoogleの研究者が提唱した深層学習モデルで、チャットAI「Chat GPT」などに使われる。「どこに注目するか」を重視したことで、自然言語処理での精度や処理速度を大幅に高めた。 米OpenAIの「ChatGPT」は2022年に公開されるやいなや、その精度の高さに世界が衝撃を受けた。このChatGPTは、同社の大規模言語モデル(LLM)「GPT(Chat Generative Pre-trained Transformer)」をベースにしている。Transformerこそ、LLMの根幹である。 Transformerはエンコーダー(符号器)とデコーダー(復号器)で構成し、「どこに注目するか」を重視するアテンション機構を中心としている。大規模並列処理に向いたモデルで、GPUでの処理を想定して設計した。 Transformerは米Google Brain(現在の米Google D

    LLMの根幹「Transformer」とは?並列処理に最適なワケ
  • OpenAIのお家騒動で浮き彫りに、気になる「AI過激派」の台頭と対立

    日経クロステック登録会員になると… ・新着が分かるメールマガジンが届く ・キーワード登録、連載フォローが便利 さらに、有料会員に申し込むとすべての記事が読み放題に! 有料会員と登録会員の違い

    OpenAIのお家騒動で浮き彫りに、気になる「AI過激派」の台頭と対立
    misshiki
    misshiki 2023/11/24
    “e/accは「Effective Accelerationism(効果的加速主義)」、EAは「Effective Altruism(効果的利他主義)」。e/accはAIなど技術の進化を何よりも優先する人々で、最近はシリコンバレーの起業家や技術者でも信奉する人々が増えている”
  • Excelの「データ分析」ボタン、数字の羅列から意外な傾向を見つけ出す

    Excelで整理する表は基的に数字の羅列だ。データ量が多いほど、この羅列から何らかの傾向を見つけ出すのは難しい。だから我々ユーザーは、数字をグラフなどにビジュアル化して傾向を可視化しようと努めるわけだ。 そういうときに意外な傾向の発見を支援してくれる機能がある。それが日紹介する「データ分析」ボタンだ。 数字の羅列を多様な切り口でビジュアル化 「データ分析」ボタンは、選択した表をExcelが独自に分析して、その結果を表示してくれる機能だ。下図では、ある新聞社3社の5年間の売り上げを示したものだ。このデータを基にして「データ分析」機能を概観してみよう。 まず、分析したい表のいずれかのセルを選んだら、「ホーム」タブから「データ分析」ボタンをクリックする。すると、シートの右側に「データ分析」作業ウィンドウが開き、瞬時に表の数値を分析してビジュアル化した結果を表示してくれる。 分析したい表のセル

    Excelの「データ分析」ボタン、数字の羅列から意外な傾向を見つけ出す
    misshiki
    misshiki 2023/11/02
    “「データ分析」ボタンは、選択した表をExcelが独自に分析して、その結果を表示してくれる機能だ”
  • ChatGPTがつくった文章や画像、著作権は認められるのか

    ChatGPTBard、Stable Diffusion、Midjourneyなどに関心を寄せるビジネスパーソンは多く、生成AI人工知能)はますます盛り上がりを見せています。ただ、開発・学習にも、業務利用やビジネス活用にも法的リスクを伴うことから、AIに関する法律問題を取り扱う弁護士には多数の相談が寄せられています。 西村あさひ法律事務所・外国法共同事業の福岡真之介氏と松下外氏も多くの相談を受けており、両氏は「生成AIの法律問題を一度整理する必要がある」との問題意識を持って、法的リスクとその対策について体系的にまとめ、ビジネスパーソン向けに書籍『生成AIの法的リスクと対策』(日経BP)を執筆しました。同書を基に、Q&A形式で生成AIの法的リスクの基を解説します。今回は、生成AIを利用する際に最も気になる疑問「AI生成物に著作権は認められるのか」を取り上げます。 Q AI生成物に著作権

    ChatGPTがつくった文章や画像、著作権は認められるのか
  • Metaがコード生成AI「Code Llama」発表、無料で商用利用可能

    米Meta(メタ)は米国時間2023年8月24日、プログラムのソースコードを生成するAI人工知能)「Code Llama」を公開した。同社の大規模言語モデル(LLM)「Llama 2」をベースとした生成AIで、Llama 2と同様に無料で商用利用可能なツールとして提供する。 自然言語によるプロンプト(指示)に従ってコードを生成するほか、入力したコードをデバッグする機能も備える。PythonC++JavaPHPTypescriptJavascript、C#、Bashなど、一般的に使用される多くのプログラミング言語に対応する。 3つのパラメーターサイズのモデルを提供する。パラメーター数はそれぞれ70億、130億、340億で、いずれも5000億トークン(おおよその単語数)のコードとコード関連データでトレーニングされているという。サイズの小さい70億と130億のモデルは、リアルタイム性

    Metaがコード生成AI「Code Llama」発表、無料で商用利用可能
  • NTTデータが生成AI使うシステム開発手法を全技術者に展開、人月型契約が見直しに

    NTTデータは法人向けシステム構築に生成AI人工知能)を格導入する。生成AIを利用したシステム開発手法やツール群を社内で整備し、2024年度から国内外の開発部門に展開する。 NTTデータは業務システム開発に携わるエンジニアが国内と海外を合わせて約10万人在籍する。生成AIを使う開発手法を全エンジニアに習得させ、営業など関係する職種も含めて全社員19万5000人が利用できる体制を目指す。 既に実証では開発工数を7割削減できたなど大きな成果事例が出ているという。システム構築の生産性が大幅に向上すると、受注できる案件を増やせる一方で、案件の単価や顧客単価が下がりかねない矛盾も抱える。システム構築の受注金額は、必要な工数を積算して算定根拠にする「人月型」の契約が主流だからだ。NTTデータは「課題を整理して、成果報酬型など顧客と新たな契約形態も検討を進める」(担当する技術革新統括部システム技術

    NTTデータが生成AI使うシステム開発手法を全技術者に展開、人月型契約が見直しに