タグ

docsに関するsh19910711のブックマーク (184)

  • Remix のドキュメントを Gemini 1.5 Flash で日本語化しました

    Remix ドキュメント日語版を公開しました はじめに この度、Remix の公式ドキュメントを日語に翻訳し、「Remix ドキュメント日語版」というサイトで公開しました。 記事では、Remix ドキュメントの翻訳を Remix を使って開発した内容について技術的な側面から説明します。また、これから Remix を使った開発を始めたい方に向けて、日語版ドキュメントを活用いただく方法についてもご紹介します。 日語版ドキュメントの構成 今回翻訳したRemixドキュメントは、以下のようなカテゴリに分かれています。 start: 5分でできるチュートリアルなど、Remixを始めるためのガイド。 discussion: Remixの設計思想や概念の解説。 file-conventions: ファイルベースルーティングや特別なファイルの規約。 route: ルートモジュールの仕様。 com

    Remix のドキュメントを Gemini 1.5 Flash で日本語化しました
    sh19910711
    sh19910711 2024/05/29
    "Gemini 1.5 Flash はマークダウンの記法を維持しつつ、英語のドキュメントを日本語に翻訳してくれます / 手作業のみでは難しい大量のドキュメント翻訳を効率的に進めることができました"
  • PDFをLLMで解析する前処理のパーサーは何が良いのか?(pdfminer, PyMuPDF, pypdf, Unstructured) - Qiita

    PDFをLLMで解析する前処理のパーサーは何が良いのか?(pdfminer, PyMuPDF, pypdf, Unstructured)PythonpdfminerPyMuPDFpyPDFUnstructured 現状の LLM は PDF ファイルを直接処理出来ない為、予めなんらかのプレーンテキスト形式に変換する必要があります。 (PDFを読める各チャットアプリも内部的には何らかの手段でプレーンテキスト形式に変換しているはずです) 変換を行ってくれるライブラリは複数存在する為、動作の違いを確認します。 抽出プログラム 抽出する対象のPDFファイルはBedrockユーザーガイドの日語版を使います。

    PDFをLLMで解析する前処理のパーサーは何が良いのか?(pdfminer, PyMuPDF, pypdf, Unstructured) - Qiita
    sh19910711
    sh19910711 2024/05/28
    "人間が読む分にはなんてことない表ですが、セルの中で改行されている時点でもう難易度が高い / PyMuPDFは同じセルのものはまとめて出力してくれています + 同じ行の中で左の列から順に出力してくれている"
  • データカタログの最初の一歩 〜データ組織向けに dbt docs を整備している話〜 / Maintaining dbt docs for data organizations

    sh19910711
    sh19910711 2024/05/28
    "データ関係の仕様書があちこちに分散 + クエリを直接読まないと分からない / 早めにデータカタログとしての場所だけ作って運用 + テーブル、クエリ、リネージグラフがサクッと確認できるだけでも十分"
  • GPT-4oを使って手書きの図からHTMLを出してもらった件

    驚異のGPT-4o はじめにこんにちは。ネクストビートでエンジニアをしている水島です。 今回は、5月14日(火)にOpenAI社によって発表された、新しいモデルGPT-4oについての紹介記事となります。 既にXなどをはじめ多方面でその驚くべき能力が知られ始めているGPT-4oですが、筆者も昨日に試してあまりの凄さに驚いてばかりです。ちなみに昨日意図せずバズったポストの著者でもあります。 GPT-4oはOpenAIが従来から提供してきたGPT-4-Turboの後継とも言えるモデルです。5月14日(火)のデモで発表された内容ではリアルタイムでの音声認識・応答などが目玉になっていましたが、こちらはまだ未公開です(数週間以内には提供されるようですが)。ですので、今回は即日リリースされたチャットボットとしてのGPT-4oの話になります。 GPT-4oについてはこの記事を読まれている皆さんも色々試され

    GPT-4oを使って手書きの図からHTMLを出してもらった件
    sh19910711
    sh19910711 2024/05/19
    "現実世界に書いた「HTMLにして」というメッセージがAIに届いた / 指示をグシャグシャっとボールペンで取り消しした上で「↑Swing+Javaでよろしく」とカジュアルに書いた画像だけをChatGPTに投げてみました"
  • 「Changelogを読んで自分のエンジニアキャリアを作る」というLTのこぼれ話 - BASEプロダクトチームブログ

    はじめまして!フロントエンドエンジニアのがっちゃん( @gatchan0807 )です。 9月7日にBASE主催で「BASE Engineer 座談会 〜BASEの若手エンジニアがそれぞれの今と未来を語る!〜」というイベントを実施したのですが、その中のLTパートで発表した「Changelogを読んで自分のエンジニアキャリアを作る」でお話しきれなかった部分があったので、そこも含めてお話した内容を記事にまとめなおしました! 当日ご参加いただいてLTを聞かれた方も、そうでない方も、ぜひご覧ください! 「Changelog」と「エンジニアキャリア」がどう繋がるのか 早速この記事でお伝えしたいことから書いてしまうのですが、 Changelogは最新機能だけでなく、未来のビジョンも含めたプロダクトの情報の宝庫で、それらをうまく使えばエンジニアキャリアづくりに活かせる! ということを記事を読んでいただい

    「Changelogを読んで自分のエンジニアキャリアを作る」というLTのこぼれ話 - BASEプロダクトチームブログ
    sh19910711
    sh19910711 2024/05/07
    "dependabotの対応でライブラリのChangelogを読む / Changelog: アップデート対象そのものの知識をつけるのに効率が良い / ChromeのChangelogを読んだ際にDevToolsの知らなかった機能をいくつも発見" 2021
  • 仕事のレポートはこう書こう | タイム・コンサルタントの日誌から

    ときおり、大学教育の意義は何だろう、と考える事がある。昭和の時代には大卒はホワイトカラー、高卒その他はブルーカラーという区分があったが、この境目は平成以降、次第に曖昧になってきている。それでも大学を出ることで、出なかった者と何ほどかの違いがあるとしたら、どのような点だろうか。まさか専門知識の有無ではあるまい。工学部を出たってすぐ設計はできないし、法学部や文学部で学んだ知識を企業が期待しているは思えまい。それでも、青年期の4年間を大学で過ごすことで、教育上得るものがあるとしたら、それは何か。 もしかしたら、それは多少なりともちゃんとした長さのレポートを、何度も繰り返し書かされることかも知れない。期末レポートや中間レポート、実験レポートから卒論まで、大学ではずいぶんレポートを書かされる。そして企業では、大卒の人間はそれなりに「考える仕事」を要求される。その“考える”ことの大事なプロダクト(成果

    仕事のレポートはこう書こう | タイム・コンサルタントの日誌から
    sh19910711
    sh19910711 2024/04/26
    "「目的」では意図と仮説を記述 + 「結論」では ~ 仮説が検証される / ここに新たな気づきが加わることによって、考察の多面性が生まれる + 単に数字やデータの並びを眺めただけでは気づかない点" 2011
  • 自分がどのLaTeXを使ってるか知りたい話 - Qiita

    今年も相変わらず「TeX & LaTeX Advent Calendar」が始まりました。今年の重点テーマは「とにかくLua(La)TeXしよう」です。LuaLaTeXに関する情報がたくさん集まることに期待しましょう。 というわけで、LuaLaTeXにイマイチ関係してないネタ話を一つ(ええっ) 人生いろいろ、“LaTeX”もいろいろ LuaLaTeXは新しい1LaTeXエンジンですが、LaTeXにある程度関心のある人なら​「最近は“LaTeXの種類”がやたらと増えている」​ということはご存知でしょう。日において(一定以上)使われているものに限っても、“LaTeXの種類”はこれだけあります。 pLaTeX ←15年ほど前はコレしかなかった2 upLaTeX pdfLaTeX XeLaTeX LuaLaTeX このうち、後の3つは「PDFファイルを直接出力する3」タイプのエンジン4です。対し

    自分がどのLaTeXを使ってるか知りたい話 - Qiita
    sh19910711
    sh19910711 2024/04/26
    "pLaTeX ←15年ほど前はコレしかなかった + pLaTeX+dvips ←15年ほど前はコレが圧倒的多数 / それぞれのLaTeXのワークフローはそれ独自の世界を作っている / ユーザは”自分のLaTeX”のための文書コードを書く必要がある" 2018
  • Runbookに何を書き、どのようにアラートを振り分けるか?

    SREのプラクティスにおいてアラートに対応するRunbookを備えることは推奨されています。しかしながら記載する内容についてはしばしば議論の対象となり、短期的な対応手順にフォーカスするのか、ハイレベルな情報にフォーカスするのか、メンテナンスのコストとのバランスをどのように取るか、むしろRunbookに時間を費やすべきではないのではないか、といったことまで様々な意見があります。 グリーではいわゆる障害対応の手順書は古くから運用されていましたが、それらは基的に一次対応にフォーカスしており、根的な原因調査のヒントがない、アラートの背景を伝えられていない、検索性が悪いなどの課題がありました。 セッションでは一つの解として、これらの課題を解決するために新たにアラートに対応するRunbookの仕組みを整備し、新規に運用を開始した事例についてお話します。 また、合わせてアラートをより有効に機能させ

    Runbookに何を書き、どのようにアラートを振り分けるか?
    sh19910711
    sh19910711 2024/04/21
    "「完全な未知のアラート」を受ける機会を減らす / Runbook志向: 背景の共有を重視 + アクションにつながる情報 + 解決につながるコンテキスト・ヒントを提示 / 解決策が定型的なコマンドであれば自動化" 2023
  • ChatGPTを使って既存の図をMermaid化してみる - Qiita

    はじめに この記事は Metaps Advent Calendar 2023 の13日目の記事です。 先日のOpenAI DevDayでGPT4の機能を切り替えることなく使用できるAll Toolsや、オリジナルのGPTが作成できるGPTsが導入されるなど、ChatGPTの大幅なアップデートが発表されました。 特にAll Toolsで GPT-4V + Code Interpreter(Advanced Data Analysis)で画像やPDFを使用した柔軟な入力やコード的な指示ができるようになったので、既存の図を読み込ませてMermaid記法で出力させてみました。 資料上の図をMermaid記法で記述したい場合や、編集したいのに元データがない場合などにも使用できると思いますので、参考になりそうな部分をかいつまんで紹介します。 稿の機能を使用するにはChatGPT Plus(月額20ド

    ChatGPTを使って既存の図をMermaid化してみる - Qiita
    sh19910711
    sh19910711 2024/04/04
    "対応していないMermaid記法の種類については公式ドキュメントのDiagram SyntaxのURLやGithubのsyntaxのmdファイルを添付すると、browsingやanalysisで解析して回答に使用してくれる" 2023
  • outage reportを書くときに気をつけていること - その手の平は尻もつかめるさ

    そうは言っても障害は起きるものです.で,障害が起きて,終息したあとの振り返りとして社内向けにoutage report (障害報告書的な?) のようなものを書くと思うのですが,記事ではそのときに気をつけていることについて書きたいと思います。 outage reportの目的 そもそもですが,outage reportを書く目的としては以下のような物があるのかなと思っています。 A: 障害が起きたという事実に関する周知 障害についてお客様からお問い合わせが来たりした時に正しい情報を届けられるようにするため B: 根原因の洗い出し 再発防止のため C: 障害検知フローの確認 障害に対する初動までにかかる時間を短くするため D: トポロジの形成 知見の醸成 似たような問題が起きたときに,outage reportに書いてある対処法を逆引き的に利用できるようにするため outage repor

    outage reportを書くときに気をつけていること - その手の平は尻もつかめるさ
    sh19910711
    sh19910711 2024/03/28
    "えてして「なんで俺が書かなきゃならんのだ……」みたいな罰当番的な感じにもなりがち / scrapboxを使っているので自然と複数人でoutage reportを書く感じになっており,ここらへんは上手くワークしている" 2019
  • 「箇条書き」をやめてみる - Qiita

    ドキュメントを書くときの工夫として「箇条書き」があります。 整理されている感じがあり、書き手・読み手のどちらにもメリットがありそうです。 しかし箇条書きを乱用すると、うまく情報が伝わないケースも出てきます。 もし「箇条書きにはしてるんだけど、"わかりづらい"と言われたことがある」という方がいれば、ぜひ読んでみてください。 「プロセス」としての箇条書きは「成果」ではない 書き手にとって、箇条書きは普通に文章を書くよりもスラスラ書けるはずです。 これは箇条書きが「思いついたことをどんどん書けるフォーマット」であり、言い換えれば「明確な論理構造を持たなくてよいフォーマット」だからです。 ゆえに、 Qiitaで箇条書きに関する記事を書くぞ どんな内容にしようか? まず箇条書きのデメリットを挙げてみるか 思いついたことは書けるけど論理はないかも 「論理構造」ってどう説明すればいいんだろう。ちゃんと調

    「箇条書き」をやめてみる - Qiita
    sh19910711
    sh19910711 2024/03/20
    "箇条書き: 思いついたことをどんどん書けるフォーマット + プロセスとしての箇条書きはとても効果的 / 接続詞: 箇条書きでは暗黙的にしか示されていなかった論理的な構造が見える"
  • draw.ioを使ってAWSの構成図を作成するコツ - Qiita

    案件でAWSの構成図を作成する機会があったので備忘兼ねて投稿します。 ※約5分で読めます 1. グループの内側から作成していく AWSの基的なグループ構成はこんな感じ 添付の場合、個人的には Public subnet or Private subnet > Availability Aone > VPC > Region > AWS Cloudの順番で作成することをオススメします。理由は内側のグループが肥大すると外側のグループの手直しが発生するためです。 今回作成した時に外側から作成してしまい、めっちゃ時間がかかってしまいました... 2. グループの左上を掴む 日語が下手ですみません。 なぜ左上を掴まないといけないか?試しにPublic subnetをクリックしてドラッグをすると、添付の様になりました。 クリックをするとグループの外から選択されてしまうため、選択したグループ内に存在

    draw.ioを使ってAWSの構成図を作成するコツ - Qiita
    sh19910711
    sh19910711 2024/03/20
    "グループの内側から作成していく: 内側のグループが肥大すると外側のグループの手直しが発生する / 構成図のサンプルを見まくる: AWSが掲載している目的別 クラウド構成と概算料金例 を見るとイメージしやすい"
  • RAG用ドキュメントとしてのデータカタログ

    データカタログの悩み dataplexやdbt docs、その他無数のSaaS製品に代表されるデータカタログは、データリネージを自動的に生成できるなど便利な機能を数多くそろえている一方で、物足りない点もまだ多く、特にマネージャー陣など非データ分析職や他チームからの問い合わせを削減することは過去の経験から考えてもまだ難しいと感じている。 自チームがデータ分析を行う際には、とりあえずデータカタログで調べてみるという形を実現できたことはあるのだが、 マネージャー「AのディメンションごとにBのメトリクスを自分で集計したいが、どのテーブルを使えばいいか」 別チームのメンバー「プロダクトXに関する指標Yが数日前から変動しているが、Xのチームで何らかの変更を行ったのか」 といった相談や問い合わせは依然としてそれなりの工数を占めていた。 組織全体でのデータ活用や複数ドメインでのデータ連携ができているという

    RAG用ドキュメントとしてのデータカタログ
    sh19910711
    sh19910711 2024/03/15
    "問い合わせに回答するのはルーチン性が高い一方でスケールさせないといずれ運用が破綻する / ドメイン知識がない質問者が自力で回答に辿り着くのは極めて難しい / ragstar: dbtのレポジトリをドキュメントとして探索"
  • Table TransformerとGPT-4Vを用いたPDF内の表の解析|QunaSys

    RAGは非常に有用なツールですが、PDFの論文などを扱う際には、表データを正しく読み取れない場合があります。 表の構造を適切に処理することは難しく、いくつかの改善策が提案されています。 例えば、RAGを構築するのに使われるライブラリであるLlamaIndexのドキュメントに以下のような情報があります。 このドキュメントでは表を含むデータを扱う方法として、PDFを一旦すべて画像データに変換し、画像として表の形式を保持したままGPT-4Vでデータを解析することを提案しています。 ただ、PDF1ページ分の画像をそのままGPT-4Vに解析させても精度はあまり良くないようで、後述するTable Transformerを使って表部分の画像のみ抽出してから解析を行うことで、より良い結果が得られたのことでした。 記事では、この方法を用いてPDF内の表の解析を試してみます。 手順としては 1. PDFの全

    Table TransformerとGPT-4Vを用いたPDF内の表の解析|QunaSys
    sh19910711
    sh19910711 2024/03/13
    "PDFに含まれる表をRAGで扱う / Table Transformer: Microsoftが公開 + PDFや画像から表部分だけを検出する深層学習モデル / 取得した表の画像と質問文をGPT-4Vに投げて、回答を生成 / AutoModelForObjectDetection"
  • モブプログラミング開発に ADR を導入した話 - Gunosy Tech Blog

    こんにちは、 Gunosy Tech Lab 所属の m-hamashita です。 最近は良い年明けを迎えるために dotfiles の整備をしています。好きな Neovim の plugin は reacher.nvim です。 この記事は Gunosy Advent Calendar 2022 の 20 日目の記事です。 19 日目の記事は sugiyama さんの 『Recoil を触ってみた話』 でした。 今回はモブプログラミング開発する中で ADR を導入した話をしたいと思います。 モブプログラミング開発については 8 日目の記事に詳しく書かれているので、気になる方はこちらを読んでみてください。 tech.gunosy.io ADR とは 導入の背景 ADR を作成する workflow の導入 使い方 workflow の実装 repositoryId と categoryI

    モブプログラミング開発に ADR を導入した話 - Gunosy Tech Blog
    sh19910711
    sh19910711 2024/01/25
    "モブプログラミングでの開発によって議論が活発になった一方で、決めたことが記録に残っておらず、あれなんだっけとなる / GitHub Actions から workflow を実行 + 本文、タイトル、Labels が埋まった状態の Discussion が作成" / 2022
  • 更新”しない”ドキュメント管理 「イミュータブルドキュメントモデル」の実運用

    ドキュメント管理を制する 陳腐化を防ぐための実践事例 Lunch LT https://findy.connpass.com/event/302508/ 上記にて登壇した際に利用した資料です。

    更新”しない”ドキュメント管理 「イミュータブルドキュメントモデル」の実運用
    sh19910711
    sh19910711 2024/01/18
    "継続して更新すべき「可変なドキュメント」をできるだけ減らし、それらの元となる意思決定を「不変なドキュメント」として記録する / 意思決定を記録するハードルを下げる + 意思決定を理解するハードルを下げる" / 2023
  • ソフトウェア設計の際には遺書を書こう

    この記事はハワイアンAdvent Calendar 2020 2日目の記事です。ツイートアナリティクスによれば、1日目のブログへのエンゲージメントは32という事だそうです。今確認のためにもう一回開いたので33です。わたしは自分のブログを何回も読み直すので、99%は自分のアクセスでしょう。これまでご愛読頂きありがとうございました。 Advent Calendarの前半では進化的アーキテクチャについて触れてやっていくつもりなので、その為の前提を埋めていきたいと思います。 2020年現在、サービス開発や製品開発の為のソースコードの自動生成が進んでいますが、残念ながら製品開発の根幹となるロジックは人間が書いています。人間がソースコードを書くこの時代において、ソフトウェア設計とはなんの為にあるのでしょうか。リファクタリングはなぜ行うのでしょうか。綺麗なコードを書くのはなんの為でしょうか。綺麗なコード

    ソフトウェア設計の際には遺書を書こう
    sh19910711
    sh19910711 2023/12/22
    "一定期間運用したらちゃんと蒸留する機会を設けよう / 取り組むものについて、寿命を計算 / その寿命を具体的な期間として示した際の根拠となる評価軸はなんでしょうか。これも書き残してください" / 2020
  • 就業規則の作り方 - かまずにまるのみ。

    会社の就業規則を整えた際、労働法周りを調べたときのメモ。 私自身は法律の専門家ではなく、労働法についても素人なので、もし間違いなどあればご指摘いただきたい。 なお、参照している法律等は2017年8月現在のものである。 就業規則とは 労働者の規律や労働条件を定めた規則を指す。 厚労省のサイトには以下のように書かれている。 常時10人以上の従業員を使用する使用者は、労働基準法(昭和22年法律第49号)第89条の規定により、就業規則を作成し、所轄の労働基準監督署長に届け出なければならないとされています。就業規則を変更する場合も同様に、所轄の労働基準監督署長に届け出なければなりません。 どうやって作る? 厚労省や労働局のサイトに就業規則のサンプルが掲載されているので、就業規則を自力で作る場合はこれをベースにしていくのがオススメ。 社労士さんなどにお任せするのもよいと思う。 モデル就業規則について

    就業規則の作り方 - かまずにまるのみ。
    sh19910711
    sh19910711 2023/11/11
    "就業規則: 改めて見てみると知らなかったことが書いてあったりしておもしろいかも / 厚労省や労働局のサイトに就業規則のサンプル / フレックスタイム、時間単位年休の導入にあたっては、労使協定の締結が必要" / 2017
  • 週報をやめて、週末にLTをすることにした ベーシック エンジニアブログ Basic->deploy('blog');

    こんにちは。株式会社ベーシック CTO の @zaru です。 今回は 週報をやめて、週末にLTをすることにした 話を紹介したいと思います。 チーム週報という活動 弊社 開発部では1年前くらいから開発チームごとに週報をQiitaチームに書こうという取り組みが自主的に行われていました。個人ごとではなく、チーム単位での週報というのが良かったです。 チーム単位だと、プロダクトや事業など技術的ではない視点が入ったり、チームの中でも、各人がどんなことをしているのかを知っていないと書けないので、自然と情報共有が進みやすかったと思います。 書くのが面倒問題と反応が薄い問題 しばらくは良い感じで運用されていたのですが、いつしか週報が形骸化してしまいました。問題は大きく2つあると考えています。 1つは週報を書く行為自体がそれなりに大変なので、単にやったことを箇条書きで羅列するだけで終わったりして、読み手に伝

    週報をやめて、週末にLTをすることにした ベーシック エンジニアブログ Basic->deploy('blog');
    sh19910711
    sh19910711 2023/10/24
    "やったことを箇条書きで羅列するだけで終わったりして、読み手に伝わらない内容 / 読み手からの反応が薄かったのも問題 / イイネボタン程度で、議論が活発になっているとは言えない" / 2017
  • JIRAをHubにした全方位向け情報共有

    "InnoCAFE#23 このやり方であってる?ドキュメント管理と情報共有のお隣事情" 登壇資料

    JIRAをHubにした全方位向け情報共有
    sh19910711
    sh19910711 2023/10/22
    "ナレッジが蓄積されていないことは0ではなくマイナス / 負債は指数関数的に増加 / 再利用されるために: なんでもそこにあるという信頼が重要 / 再利用できないと意味がない / 書いたら盛り上がる風潮をつくる" / 2016