タグ

sh19910711のブックマーク (26,573)

  • TOEIC850点までの8ヵ月強(310.9時間)のまとめ - 青春B■雑記blog‐青酸カリ カラメルシロップ味‐

    blogの英語学習に関する記事の一覧はこちらです(随時更新しています)。 前の記事に書きましたように、勉強開始からTOEIC850点までの8ヵ月強(310.9時間)のまとめです。 使ったやらサイトやら、それぞれどれだけ勉強したかとかどう勉強したかとか。 なるべく余すことなく書こうと思った結果、かなり長文になっちゃいました。 どなたかの参考になれば嬉しいです。 無料サービスについては最近はてなブックマークを集めていた英語コンプの馬鹿でも投資ゼロでTOEIC900に達するたったひとつの方法 とそのトラックバック周りが色々語ってくださっています。 ちなみにこの310.9時間という勉強時間は「勉強するぞ!」という姿勢でやパソコンなりに向かった時間数なので 移動中にイヤホンで聴く 洋楽を聴く ご飯をべている後ろで英語のニュース流す 英語でチャット 英語でメールやり取りといった時間は含めていま

    sh19910711
    sh19910711 2024/05/29
    "ただ触れているだけの時間の学習効果はそれほど / 英語の発音がよくなる本: 最初にやるべきは発音 + 英語はすべてカタカナで表現できるとけっこう真剣に思っていたので、この本の内容は衝撃的" 2009
  • AIによるコードレビュー "PR-Agent" を導入した効果と課題について

    モノレポ環境にPR-Agentを導入した効果と課題について書いています。 導入結果としては、AIによるコードレビューが効果がある一方で、現時点では全てのレビューがAIに置き換えることはないことが分かりました。 この記事では、PR-Agentの具体的な効果、実際に感じた課題、課題に対する横断チームの対応策などを掘り下げています。

    AIによるコードレビュー "PR-Agent" を導入した効果と課題について
    sh19910711
    sh19910711 2024/05/29
    "PR-Agent: Pull Requestで変更されたコードの分析・要約・レビュー + よくあるミスの指摘は精度が高い / 一定の開発スキルやリテラシーを持つ開発者のサポート機能であり高機能なLinter + 期待しているほど効果はない"
  • プロンプトからREST APIを作るサービス『Hanabi.REST』の技術構成

    Hanabi.REST AIにHonoJSのバックエンドを書かせて遊ぶ、Hanabi.RESTというサービスを一般公開します。それに際して、この記事では、Hanabiの紹介と簡単に技術スタックを解説していきます。 皆さんは、AIがプロンプトからUIを生成する、V0というサービスをご存じですか?僕はあれを見たときに、ある妄想が膨らみました。 「V0のAPI版があれば、プロンプトからWebアプリケーションを作れるやん!!」と。 当初はハッカソン用の小プロジェクトとして始めましたが、想定以上に面白い結果が得られたため、開発を継続することにしました。技術的な制約、様々な黒魔術による不安定な挙動、LLMの劣化など、数多くの壁を乗り越えながら、約半年をかけてようやくリリースに至りました!! 次のリンクから実際にAIが生成したTwitter風のAPIを試すことが出来ます! また、会員登録すれば誰でもAP

    プロンプトからREST APIを作るサービス『Hanabi.REST』の技術構成
    sh19910711
    sh19910711 2024/05/29
    "速く、面白く、動くをコンセプトに開発 / プロンプトを元にAIがAPIの仕様を決めて、SQLを書き、HonoJSで実装 / 生成されたAPIは、ブラウザ上でそのまま試すことが出来る上に、ローカル環境にクローンしたり"
  • GPT-4oを使って画像を分析してみた - GMOインターネットグループ グループ研究開発本部

    TL;DR OpenAIは、2024/05/13にGPT-4oをリリースしました。GPT-4oは、画像とテキスト、音声などを同時に処理することができるモデルで、従来よりも高速な実行が可能です。 GPT-4 Turbo with visionで行ったように、GPT-4oのAPIを利用してグラフの解説を試したところ、ある程度はもっともらしい解説は可能ですが、やはり正確な数値の読み取りなどには課題が残る結果となりました。 特にChatGPTでは、入力した画像だけではなく、既に学習済みの知識をカンニングしている可能性があります。ペンギンの性別や種のラベル、体重の数値を入れ替えた場合、これらの事前知識に影響されたと思われる回答が得られました。 はじめに こんにちは、グループ研究開発部・AI研究室のT.I.です。先日5/13に、OpenAIは新しいGPT-4o(omni)をリリースしました。GPT-

    GPT-4oを使って画像を分析してみた - GMOインターネットグループ グループ研究開発本部
    sh19910711
    sh19910711 2024/05/29
    "ChatGPTでは、入力した画像だけではなく、既に学習済みの知識をカンニングしている可能性があり / 数値を入れ替えた場合、これらの事前知識に影響されたと思われる回答が得られました"
  • 入門プロパティベーステスト/learning-property-based-testing

    ユニットテスト新着トピック3選!イチからわかるイマドキのテスト https://trident-qa.connpass.com/event/314818/ での発表資料です。

    入門プロパティベーステスト/learning-property-based-testing
    sh19910711
    sh19910711 2024/05/29
    "プロパティベース: プロパティで問題をとらえる + ジェネレータで入力を生成 + 事後条件を検証する / 満たすべき挙動を形式化してとらえることで問題に集中 / 事例の抜け漏れ、個人差などを考慮する必要が減る"
  • Gemini 1.5 Proを使って自分の強みを分析してみた - G-gen Tech Blog

    G-gen の神谷です。今回、Gemini 1.5 Pro を活用して、ビジネス心理テストであるストレングスファインダーで自身の強みを分析し、AI によるマネジメントやメンタリングが可能か、試してみました。記事では、その取り組みの詳細をご紹介します。 ストレングスファインダーとは Strength Mentor Bot の作成 Gemini 1.5 Pro を使った実装 34の資質を JSON 形式で抽出 BigQuery への保存と分析 チームビルディングへの応用 ストレングスファインダーとは まず、ストレングスファインダーについて説明します。 ストレングスファインダーは、個人の強みを特定し、それを活かすための評価ツールです。クリフトンという心理学者によって開発され、現在はギャラップ社が提供しています。 34の資質(強み)を測定し、個人の弱みではなく強みに焦点を当てることで、より良いパ

    Gemini 1.5 Proを使って自分の強みを分析してみた - G-gen Tech Blog
    sh19910711
    sh19910711 2024/05/29
    "以前はGemini 1.0を使っており、PDFの分割やチャンクごとのエンベディング抽出、類似ベクトル検索などの前処理が必要でしたが、Gemini 1.5 Proではそれらが不要に / PDFを読み込み、プロンプトと一緒にcontents配列に入れるだけ"
  • BigQuery の 履歴ベースの最適化 (History-based Optimizations) を試したかった

    はじめに こんにちは、クラウドエース データソリューション部所属の濱です。 データソリューション部では、Google Cloud が提供しているデータ領域のプロダクトについて、新規リリースをキャッチアップするための調査報告会を毎週実施しています。 新規リリースの中でも、特に重要と考えるリリースを記事としてまとめ、ページのように公開しています。 クラウドエース データソリューション部 について クラウドエースの IT エンジニアリングを担う システム開発統括部 の中で、特にデータ基盤構築・分析基盤構築からデータ分析までを含む一貫したデータ課題の解決を専門とするのが データソリューション部 です。 弊社では、新たに仲間に加わってくださる方を募集しています。もし、ご興味があれば エントリー をお待ちしております! 今回紹介するリリースは、2024年4月1日にリリースされた「クエリの履歴ベースの

    BigQuery の 履歴ベースの最適化 (History-based Optimizations) を試したかった
    sh19910711
    sh19910711 2024/05/29
    "History-based Optimizations: すでに実行した類似クエリの実行情報を使用して追加の最適化を適用 + ロジックが似ている処理を繰り返し行う場合に本機能が適用 / 類似の定義は公式ドキュメントには記載がありません"
  • Google が Chromebook Plus 向け Gemini と AI を活用した新機能を発表 | HelenTech

    Google は昨年10月に Chromebook Plus デバイスを発表し、将来的に Google AI との連携が行われることを発表していましたが、今回改めて Chromebook 向けの AI と Gemini を活用した新機能が発表され、様々な AI 機能と Chromebook Plus に Gemini が統合されることが明らかになりました。 昨年発表されていた新しい AI 機能は、次の ChromeOS のメジャーアップデートである ChromeOS 125 で Chromebook Plus デバイスに追加される予定となっており、これには AI 画像生成Google フォトの「編集マジック」、AIによるテキスト入力補助の「Help me Write」などが含まれています。 ChromeOS 125 で追加される AI 新機能 AI 画像生成は、Chromebookの壁

    sh19910711
    sh19910711 2024/05/29
    "画像生成や Google フォトの「編集マジック」、AIによるテキスト入力補助の「Help me Write」など + ChromeOS 125 で Chromebook Plus デバイスに追加される予定 / Web 上でテキストを素早く要約するための「Help Me Read」機能"
  • RAGで文書を1トークンに圧縮する「xRAG」について

    株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ向けに開発提供しているスタートアップです。 記事では、「xRAG」という手法について、ざっくり理解します。「xRAG」とは、RAGシステムでLLMに投げるドキュメント(通常、数千文字ほどですよね。)を、1トークンに圧縮できるのでは?という手法です。 この記事は何 この記事は、RAGをする際にLLMに渡すドキュメントを1トークンまで圧縮できる手法「xRAG」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は以下の記事もご参考下さい。 題 ざっくりサマリー 「xRAG」は、RAGで渡すコンテキストを極限まで圧縮する手法です。北京大学/Microsoftの研究者らによって2024年5月に提案されました。「xRAG」を使うメリッ

    RAGで文書を1トークンに圧縮する「xRAG」について
    sh19910711
    sh19910711 2024/05/29
    "xRAG: RAGでLLMに渡す関連文書をベクトル形式のままに渡すことで1トークンで済ませよう / コンテキストを圧縮できるのでRAGの回答速度が早くなる / どうやってこの変換器を作るのかが論文で説明"
  • LLM でブラウザを操作する WEB エージェントと周辺技術のざっくり紹介 - Algomatic Tech Blog

    こんにちは。Algomatic NEO(x) カンパニー機械学習エンジニアの宮脇(@catshun_)です。 記事ではブラウザやモバイル画面を操作する LLM エージェントとその周辺技術について超ざっくりと紹介します。 社内に向けたキャッチアップ資料として作成しており、加筆修正する可能性がありますが、記事を読んだ方の議論のネタ程度になってくれれば幸いです。 以前 AI ソフトウェアエンジニアについて紹介しているので、こちらもご覧いただけたら幸いです。 おことわり 記事では対象とする研究棟の 詳細な解説は含みません。詳細は元の論文を参照ください。 不十分また不適切な言及内容がありましたらご指摘いただけますと幸いです。 プロダクト等の利用時は 必ずライセンスや利用規約を参照して下さい。 記事の目次 Google I/O '24 での Gemini Nano × Android の発表

    LLM でブラウザを操作する WEB エージェントと周辺技術のざっくり紹介 - Algomatic Tech Blog
    sh19910711
    sh19910711 2024/05/29
    "Gemini Nano: オンデバイス + スマホがネット環境下にない状態でも動作 + Pixel 8 Pro および Samsung S24 シリーズのデバイスでのみ利用可能 / HTLM: Common Crawl から抽出された HTML で学習された BART ベースのモデル"
  • ローカルLLMの長文推論、メモリ使用量を節約する方法:KVキャッシュの量子化|AIサトシ

    大規模言語モデル(LLM)において、メモリ使用量の効率化は非常に重要です。特に長文処理を行う場合です。モデルに入力するコンテクストが長くなるほど、メモリ消費量も増加します。 プロンプトに入力する文字数(Token数)と必要メモリについて計算したメモ📝 精度との兼ね合いですが、長文扱うときは、mistral-v0.1圧倒的にコスパ良い pic.twitter.com/Nqn5SXDZ9u — AI𝕏サトシ⏩ (@AiXsatoshi) May 27, 2024 Mistral-7Bは、v0.1では、約4K tokensのSliding window attention(SWA)にて、コンテクスト長に消費されるメモリを低減しました。しかし、性能への影響からと考えますが、v0.2以降のアップデートで、SWAは排除されています。入力トークンを絞ることでメモリ容量を低減すれば、当然複雑性や表現力

    ローカルLLMの長文推論、メモリ使用量を節約する方法:KVキャッシュの量子化|AIサトシ
    sh19910711
    sh19910711 2024/05/29
    "Mistral-7B: v0.2以降のアップデートでSWAは排除 + 入力トークンを絞ることでメモリ容量を低減すれば当然複雑性や表現力が低下 / KVキャッシュ量子化: 計算結果を保存して再利用 + 消費者向けGPUでより長いテキスト生成が可能"
  • Remix のドキュメントを Gemini 1.5 Flash で日本語化しました

    Remix ドキュメント日語版を公開しました はじめに この度、Remix の公式ドキュメントを日語に翻訳し、「Remix ドキュメント日語版」というサイトで公開しました。 記事では、Remix ドキュメントの翻訳を Remix を使って開発した内容について技術的な側面から説明します。また、これから Remix を使った開発を始めたい方に向けて、日語版ドキュメントを活用いただく方法についてもご紹介します。 日語版ドキュメントの構成 今回翻訳したRemixドキュメントは、以下のようなカテゴリに分かれています。 start: 5分でできるチュートリアルなど、Remixを始めるためのガイド。 discussion: Remixの設計思想や概念の解説。 file-conventions: ファイルベースルーティングや特別なファイルの規約。 route: ルートモジュールの仕様。 com

    Remix のドキュメントを Gemini 1.5 Flash で日本語化しました
    sh19910711
    sh19910711 2024/05/29
    "Gemini 1.5 Flash はマークダウンの記法を維持しつつ、英語のドキュメントを日本語に翻訳してくれます / 手作業のみでは難しい大量のドキュメント翻訳を効率的に進めることができました"
  • ヤフーにおけるデータ文化の育み方 〜 Z Data Meetup βのご紹介

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、CDO室の天神林です。 ヤフーにはいくつもの事業があったり、Zホールディングスとしてのグループ会社があるので、時にはそれらを横断して仕事を進めていく必要があります。CDO室では、そんなヤフーが持つ多様かつ大量のデータを価値に変えていくことを目的にして、組織に縛られないさまざまなデータ利活用のプロジェクトを推進しております。 記事では、その中でもデータ活用に向けた事例共有・教育・相互理解という観点から、LINEと合同で企画・運営をしているミートアップについてご紹介します。 グループのデータ利活用における課題意識 バックグラウンドの異なる方と協業するにあたり、相手の持っている物事の考え方や進め方・担当領域などを理解し尊重

    ヤフーにおけるデータ文化の育み方 〜 Z Data Meetup βのご紹介
    sh19910711
    sh19910711 2024/05/29
    "データに関わる職種は、非常に幅広いかつ新しい定義を持ち合わせている / こういった認知のずれが人材の交流や活用を妨げているのであれば、それを補正することにリソースをかけても良いのでは" 2022
  • 多変量正規分布でギブスサンプリングでベイズ推定 - 結婚制度の廃止を望んでやまない

    これの続き。多変量の正規分布でギブスサンプリングしたい。 あるデータ点 とそのサイズ 、平均 、分散共分散行列 がある。確率密度関数 は以下となる。 今、データ とそのサイズ がある。ギブスサンプリングでパラメータを推定するには、パラメータ 、 の条件付き確率が必要だ。 については簡単である。 よって は 以下からサンプリングすればよい。 は多変量正規分布である。 つづいて の条件付き確率。 は正方行列のtraceを得る関数で、の正方行列 のtraceは である。特にの場合は、あるいは がスカラ量の場合は、である。行列の積に対するtraceは、順序を循環させてもtraceは等しくなる( )。 よって、スカラ量となる は と等しい。 なぜtraceを導入するのかといえば、 は規格化すると逆Wishart分布の確率密度関数 になるからだ。つまり以下となる。 試しに適当なデータに対して平均と分散

    sh19910711
    sh19910711 2024/05/29
    "ギブスサンプリングでパラメータを推定するには、パラメータ 𝜇、 𝛴 の条件付き確率が必要 / データが少ないクラスタに対して、そのクラスタのパラメータをリセットし、別のクラスタを2分割している" 2017
  • 時間情報表現抽出とルールベース解析器のこれから / Temporal Expression Analysis in Japanese and Future of Rule-based Approach

    NLP Hacks vol.3】『実装』に特化した、NLP勉強会コミュニティ開催! https://connpass.com/event/241079/

    時間情報表現抽出とルールベース解析器のこれから / Temporal Expression Analysis in Japanese and Future of Rule-based Approach
    sh19910711
    sh19910711 2024/05/29
    "時間情報表現: 患者が訴える症状の発生時期やそこからの経過は診察において重要 / Temporal Relation Extraction などと呼ばれるタスク / 大規模言語モデルによる改良: ルールベース解析器の結果を学習データに利用する流れ" 2022
  • Microsoft社製AutoMLツールFLAMLが便利すぎた! - Qiita

    はじめに 記事ではMicrosoft社製のAutoMLツールであるFLAMLについて数ヶ月使用してみたので、使用感や私が考える効果的な使い方などと共にご紹介したいと思います。 AutoMLツールはいろいろ出てきていますが、その中でもFLAMLは使いやすく拡張性の高い印象です。特にAzureを使っている場合はメリットも大きいでしょう。 日語の記事が少ないようなので、記事がFLAMLを使う上で参考になれば幸いです。 FLAMLとは 最初に紹介した通り、FLAMLはMicrosoft社製のAutoMLツールです。 AutoMLと一言で言ってもいろいろありますが、FLAMLはxgboostやlightgbmなど複数の機械学習アルゴリズムの中から最適なモデルとそのモデルの最適なパラメータを自動でチューニングしてくれる機能を提供します。また、NASのように大量の計算リソースを必要とするわけではな

    Microsoft社製AutoMLツールFLAMLが便利すぎた! - Qiita
    sh19910711
    sh19910711 2024/05/29
    "FLAML: 複数の機械学習アルゴリズムの中から最適なモデルとそのモデルの最適なパラメータを自動でチューニング + NASのように大量の計算リソースを必要とするわけではなく、非常に高速かつ軽量なのが特徴" 2022
  • ChainlitとLangGraphを活用してAgentによる画像認識を実現する方法

    はじめに 5月13日にGPT-4oがOpenAIから発表されました。 この発表以降、Xでも多くの方がGPT-4oを試した感想を書いていました。 その中で画像認識の精度が上がって、かなり使える機能になってきているとの話があり、気になったのでまずはAPIから使えるようにしてみました。 OpenAIのモデルがVisionに対応したのはだいぶ前になりますが、 値段の割にあんまり精度が良くなさそうだったので、お恥ずかしながら今まで試したことがありませんでした。 なので今回は、 VisionのAPIドキュメントを一通り読む Chainlitのマルチモーダル機能の挙動を確認する 以前作成したChainlitとLangGraphのAgentアプリで画像認識をできるようにする という手順でやっていきたいと思います。 Vision APIのドキュメント確認 まずはVisionの使い方やコストについて、Open

    ChainlitとLangGraphを活用してAgentによる画像認識を実現する方法
    sh19910711
    sh19910711 2024/05/29
    "チャットに貼られた画像を使用したい / high: まず512px × 512pxのサイズに変換した画像を見る + 2048px × 768pxに収まるように画像をスケーリング + スケーリングした画像を512px × 512pxのタイルに分割"
  • ガロア理論超入門 - 美的数学のすすめ

    ここまで見てきたガウス周期をガロア理論の立場から見直してみます。ガウスはガロア理論を知りませんでしたが、円分体に関しては、完全にガロア理論と同様のことを理解していたと言われています。 ガロア(Galois)は1811年生まれですからガウスが34歳の時に生まれました。そして、20歳のとき決闘で死ぬまでにはガロア理論の構想はできていましたから、ガウスが50歳前後のときにはガロア理論は誕生していたことになります。(ちなみに、ガウスは77歳で亡くなっています。)ガロアが決闘に行く前日に友人のシュヴァリエに宛て「ヤコビかガウスに、これらの定理の正しさではなく重要性について、公の場で意見を求めてほしい。」と最後の手紙を書きました。("定理の正しさではなく重要性について"と書いたのは、ガロアにとってガロア理論-後にそう呼ばれることとなった一連の理論-が正しいことは当然だったのでしょう。)しかし、残念なが

    ガロア理論超入門 - 美的数学のすすめ
    sh19910711
    sh19910711 2024/05/29
    "ある「多項式の解の関係」を、より扱い安い群の言葉で表そう / 係数の範囲を複素数(より、一般的には代数閉体)とすると、全ての方程式は解を持ち ~ 全ての方程式は一次式に因数分解ができてしまいます" 2015
  • これでわかるかもしれないガロア理論の入り口 - Qiita

    0. はじめに ガロア理論というのは、一言で言うと、「体」の「自己同型写像」が構成する「群」の構造とその体の構造とのあいだの関係性についての理論です。 ここでは、以下の流れでガロア理論の話をすすめています。 前半は、ガロア群に至るまでの直観的認識を身につけるための話です: 「体」およびそのいくつかの重要な性質を認識する 「自己同型」という視点について、具体的な体を例に認識する 自己同型写像全体が持つ演算構造として、「群」を認識する 群の全自己同型写像でも一切変化しない元があり、それらの元だけでも「部分体」が成立している関係を認識する 部分体とその元の体との間にある関係をもたらした、元の体の自己同型写像の群(「ガロア群」)にある演算構造の特徴を認識する 後半は、このガロア群の具体例についての話です: 具体的に、2の3乗根の体のガロア群、および、2の5乗根の体のガロア群を導出し、それらの分析を

    これでわかるかもしれないガロア理論の入り口 - Qiita
    sh19910711
    sh19910711 2024/05/29
    "体: 加減剰余の四則演算を備えた数の集合 / 準同型写像: 変換してから演算をかけても、演算をかけてから変換しても、結果は同じである性質のある写像 + 関係を保存する集合要素変換器" 2018
  • 論文翻訳: Deep Clustering for Unsupervised Learning of Visual Features - MOXBOX #DeepCluster #CNN

    \( \def\vector#1{\boldsymbol{#1}} \) \( \newcommand{\argmax}{\mathop{\rm argmax}\limits} \) Mathilde Caron, Piotr Bojanowski, Armand Joulin, and Matthijs Douze Facebook AI Research Abstract 概要: クラスタリングはコンピュータ・ビジョンで広く適用され研究されている教師なし学習方法の一種である。しかし大規模なデータセット上での視覚的特徴量の end-to-end 学習にクラスタリングを適用させる研究は殆ど行われていない。研究では、ニューラルネットワークのパラメータと、その結果として得られた特徴量のクラスタ割り当てを組み合わせて学習するクラスタリング手法である DeepCluster を提示する。Deep

    論文翻訳: Deep Clustering for Unsupervised Learning of Visual Features - MOXBOX #DeepCluster #CNN
    sh19910711
    sh19910711 2024/05/29
    "DeepCluster: k-means を使用して特徴量を反復的にグループ化 + そのクラスタ割り当てを次の学習の教師として使用しネットワークの重みを更新 / このタイプの交互の手順は自明解 (trivial solution) になりがち" 2018