並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 19 件 / 19件

新着順 人気順

オンコールの検索結果1 - 19 件 / 19件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

オンコールに関するエントリは19件あります。 SRE運用監視 などが関連タグです。 人気エントリには 『障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開』などがあります。
  • 障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開

    クラウド対応のログ可視化ツールとして知られる「Grafana」や監視システム「Prometheus」などを開発し提供するGrafana Labsは、障害発生時に担当者へのオンコールを自動化できるオンコールマネジメントソフトウェア「Grafana OnCall」をオープンソースで公開したことを明らかにしました。 Introducing the newest member of our open source family: Grafana OnCall OSS brings on-call management to the open source community #grafanaconline #oncallmanagement https://t.co/Nkq8frQx2r — Grafana (@grafana) June 14, 2022 Grafana OnCallは、昨年(2

      障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開
    • 「オンコール対応するエンジニアの睡眠時間を確保せよ」 GMOペパボSREチームの6つの取り組み

      サービスの信頼性を守るため、オンコール対応は重要な仕事だ。だが、夜中に何度も呼び出されるような状況ではエンジニアの肉体的、精神的な疲労は計り知れない。Cloud Operator Days Tokyo 2022のセッション「信頼性を落とさず効果的にオンコールを減らす取り組みを目指して エンジニアの睡眠時間を守ろう」では、こうしたオンコール対応におけるエンジニアへの負担を軽減させる取り組みを紹介した。 「常に何らかのアラート情報が流れている」 GMOペパボの渡部龍一氏(技術部プラットフォームグループ)の役割は、GMOペパボの各種サービスの可用性を確保しビジネスの成長に合わせて適切な環境を提供することだ。そのためのさまざまな業務をこなす中で、オンコール対応は悩みの種になっていた。 「私のチームで対応するサービスだけでも100を超えており、平均すると2、3日に1回のペースで何らかのアラートが発生

        「オンコール対応するエンジニアの睡眠時間を確保せよ」 GMOペパボSREチームの6つの取り組み
      • 続・何でも屋になっている SRE 的なチームから責務を分離するまでの道のり 〜新設チームでオンコール体制を構築するまで〜 - Repro Tech Blog

        こんにちは、Platform Team というチームでマネージャーをしている荒引 (@a_bicky) です。 Platform Team は、データエンジニア・アーキテクト的な役割を担う Repro Core Unit と、インフラエンジニア・SRE 的な役割を担う Sys-Infra Unit から成るチームです。 先月 SRE Lounge #15 で「何でも屋になっている SRE 的なチームから責務を分離するまでの道のり 〜新設チームでオンコール体制を構築するまで〜」と題して次の発表をしたんですが、時間の都合上話せなかった内容があるので、それらについて触れたいと思います。 なお、当日の発表内容は動画でも視聴可能です。 アジェンダ 本エントリーのアジェンダは次のとおりです。 SRE Lounge #15 での発表内容の要約 Repro Core と Sys-Infra の棲み分け R

          続・何でも屋になっている SRE 的なチームから責務を分離するまでの道のり 〜新設チームでオンコール体制を構築するまで〜 - Repro Tech Blog
        • 医師のオンコールや当直「待機」は労働時間に含めるべき?―医療経済研究より | 医師転職研究所

          病気やケガは昼夜・休日問わず発生し状態も変化していきます。そのような患者のタイミングに合わせるため、医師には実際に診療に従事している時間以外に、オンコールや当直といった「待機」の時間も必要になってきます。 しかし、オンコールや当直は労働時間にみなされない場合もあるなど、実働時間に比べて待機の時間に対する法律や報酬の面での評価は相対的に低くなっています。果たして、この状況は適切なのでしょうか?オンコールや当直の待機の負担について勤務医はどのように感じているのでしょうか?以下では、これに関して研究した最近の論文を紹介します。 オンコールや当直「待機」の時間は実働時間以上に医師の勤務意欲を低下させる 医療経済研究(医療経済学会雑誌/医療経済研究機構機関紙)に掲載されたこの論文[1]では、所定外の労働時間を実働時間と待機時間に分け、また待機時間の中でも当直とオンコール業務に分けて、それぞれの医師が

            医師のオンコールや当直「待機」は労働時間に含めるべき?―医療経済研究より | 医師転職研究所
          • オンコール死ね

            オンコールで起こされた。電話だけで済んだけど、こんな時間に問い合わせ対応するとそのあと眠れなくなる。24時間365日、いつ電話鳴るかわからないのはつらい。鳴っても鳴らなくてもつらい。緊急対応手当もっとたくさんほしいし、待機手当がほしい。割りに合わない。

              オンコール死ね
            • 燃え尽きエンジニアを救う「オンコール最適化、5つの教訓」|インシデント管理プラットフォーム│PagerDuty

              DevOpsチームの中で、業務としての「オンコール対応プロセス」はよく話題に上ることがあります。では一方で「オンコール対応に従事するチームメンバーが抱える個人的な悩みや問題」についてはどうでしょうか? 「オンコールシフト中のストレスや不安にどう対処したらよいか?」 「オンコールローテーションと子供の世話といったメンバーの個人的な事情を両立させるにはどうしたらよいか?」 「燃え尽きや離職といった問題は、チームメンバー同士の思いやりで解決できるのか?」 オンコール対応のプロセスが適切にマネジメントされていたとしても、オンコール対応チームにおけるこういった悩みは尽きません。そこでPagerDutyでは、2021年11月から12月にかけて、9つのチームからオンコール担当のエンジニアを集め「担当者の現場目線から見たオンコール対応についてのディスカッション」を実施しました。チームメンバーがオンコール対

                燃え尽きエンジニアを救う「オンコール最適化、5つの教訓」|インシデント管理プラットフォーム│PagerDuty
              • Backlog開発チーム自身によるオンコール対応を支えるアラート通知システム | Backlogブログ

                こんにちは、Backlog SREチームのmuziです。 この記事は SRE Advent Calendar 2019 の10日目、およびBacklog Play化プロジェクトブログの番外編です。 先日のブログ記事「SREは大規模なリプレイスプロジェクトで発生した様々な問題にどう取り組んだか【Backlog Play 化プロジェクト】」の後半では、Play化プロジェクトの終了後に、開発チーム自身によるオンコール対応の取り組みを始めたことを軽くご紹介しました。 私を含むBacklogのSREチームは、このオンコール対応を助けるためのアラート通知システムを作り、開発者なら誰でも使える形で提供しています。この記事では、前回のブログ記事では書ききれなかった、このシステムの詳細をご紹介します。 同じような問題意識を抱えていて、これからオンコール対応を見直したい、と考えているSREや開発者の参考になれ

                  Backlog開発チーム自身によるオンコール対応を支えるアラート通知システム | Backlogブログ
                • New Relic流、オンコールとインシデント対応の成功への道

                  成功者がどのようにNew Relicを使用してKubernetesのパフォーマンスを4倍に向上させ、拡張性とスループットを改善したかをご覧ください。

                    New Relic流、オンコールとインシデント対応の成功への道
                  • 心房細動が続いてる。そういえば、透析のオンコール待機をやる人が不足してるらしい。 - ダブルライセンス ペースメーカも人工透析も医療は黒く輝

                    今日も寒いかな・・・と思いきや、 HCUはなんかムシムシしていた。 これは、エアコンの設定の問題なのかな。 昨日の透析中に心房細動になってしまって その後、どうしたかなって思ったのだけど 朝出勤してみて HCUに行ってみたら まだ、心房細動のままだった。 え?昨日の手術後の患者さんの話。 昨日は、頻脈になっちゃう感じの心房細動だったのだけれど 徐脈性の心房細動になっていた。 いつもは10時頃に行くと 透析を始められるのだけど 行ってみても、清拭がまだ終わってなくて 更に30分後に ようやく透析を始められた。 8時間透析だから、 帰るの遅くなりそう・・・。 まあ、今日も遅くなったけど。 でも、良かったことに 透析を始める頃には 心房細動が何故か治まっていた。 もともと、一過性の心房細動があるみたいで 心房細動を繰り返す感じ。 いわゆるpafってやつ。 治ったり、なったり、治ったり、なったり

                      心房細動が続いてる。そういえば、透析のオンコール待機をやる人が不足してるらしい。 - ダブルライセンス ペースメーカも人工透析も医療は黒く輝
                    • オンコール対応とは?〜現場担当者が語るオンコール対応の不安解消方法を解説!~|インシデント管理プラットフォーム│PagerDuty

                      DevOpsの導入によって、開発エンジニアがサービスの信頼性と可用性に対する責任を負い、オンコール対応に携わるようになりました。オンコールは重要な職務ですが、精神的な負荷が大きいため不安を感じる方も多く、いわゆる「燃え尽き症候群」に陥る方も生じます。 そこで今回は、PagerDutyコミュニティのメンバーから寄せられた、オンコール対応の不安を取り除く方法や、オンコールローテーションに臨む際のアドバイスをご紹介します。ぜひ、今後の参考にしてください! インシデント管理における「オンコール対応の重要性」オンコールとは、勤務時間外を含めて緊急対応が必要なインシデントに対応できるように、対応者や担当時間を決めておく仕組みです。 現在は、24時間365日稼働が前提となるシステムが多いなか、サービスの信頼性を守るには迅速なインシデント対応が求められます。仮にサービスが停止することになれば、機会喪失や顧

                        オンコール対応とは?〜現場担当者が語るオンコール対応の不安解消方法を解説!~|インシデント管理プラットフォーム│PagerDuty
                      • 全員野球からPagerDutyまで。NewsPicksのオンコール体制はどう進化してきたか。 - Uzabase for Engineers

                        こんにちは!NewsPicksエンジニアの森川です。今回はNewsPicksのオンコール(=障害対応)体制の変遷と試行錯誤をご紹介したいと思います。 オンコール1.0 ~ 全員野球時代 ~ オンコール2.0 ~ 当番制時代 ~ 1. 専門外のアラートに対応できない 2. 対応するエラーの数が多すぎる 3. 勤務時間の自由度が減る 4. slackに気づけない オンコール3.0 ~ PagerDuty時代 ~ 1. アラートを緊急度で仕分け 2. 当番ローテーションの変更 3. PagerDutyの導入 おわりに オンコール1.0 ~ 全員野球時代 ~ NewsPicksにはエンジニア全員が入るslackチャンネルがあり、ここで周知事項の共有や雑談、問い合わせがされています。昔はこれに加え不具合の報告や監視システムからのアラート通知もこのチャンネルに流れるようになっており、アラート通知は気づ

                          全員野球からPagerDutyまで。NewsPicksのオンコール体制はどう進化してきたか。 - Uzabase for Engineers
                        • 障害発生時に担当者へのオンコールを自動化 「Grafana OnCall」がオープンソースで公開

                          この記事は新野淳一氏のブログ「Publickey」に掲載された「障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開」(2022年6月16日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。 クラウド対応のログ可視化ツールとして知られる「Grafana」や監視システム「Prometheus」などを開発し提供するGrafana Labsは、障害発生時に担当者へのオンコールを自動化できるオンコールマネジメントソフトウェア「Grafana OnCall」をオープンソースで公開したことを明らかにしました。 Grafana OnCallは、2021年11月に買収を発表したAmirが開発したソフトウェアで、発表と同時にGrafana Cloudのクラウドサービスとしても提供が開始されました。 今回それがオープンソースとして公開されたことに

                            障害発生時に担当者へのオンコールを自動化 「Grafana OnCall」がオープンソースで公開
                          • オンコール体制をアップデートした話 - Pepabo Tech Portal

                            こんにちは!技術部プラットフォームグループでマネジャーを担当しているトラです。プラットフォームグループ(以降はPFGと省略します)では複数のペパボサービスを横断的にSREとして支えています。この記事ではSREの重要な責務のひとつである「オンコール」をトピックに、取り組んだことを紹介します。 背景 PFGは複数の事業部をまたがる横断組織であり、事業部とチームを1対1で用意しています。2021年末に関わる事業部の範囲を広げるべく、チームメンバーの再構成とチームの新設を行いました。 チームを再構成したことによる負担軽減の対策のひとつとして、オンコール体制のアップデートを行いました。 どうオンコール体制を変えたか 体制変更前は担当する事業部チームとオンコール担当は同じメンバーでした。変更後の体制では、日中帯の運用タスクは担当事業部チームで対応し、夜間休日オンコールは担当チームの枠を超えて全サービス

                              オンコール体制をアップデートした話 - Pepabo Tech Portal
                            • 何でも屋になっている SRE 的なチームから責務を分離するまでの道のり 〜新設チームでオンコール体制を構築するまで〜 / SRE Lounge #15

                              https://sre-lounge.connpass.com/event/290455/ の発表資料です。 発表動画や発表で触れられなかった内容については https://tech.repro.io/entry/2023/09/28/101708 に載っています。

                                何でも屋になっている SRE 的なチームから責務を分離するまでの道のり 〜新設チームでオンコール体制を構築するまで〜 / SRE Lounge #15
                              • オンコール担当がインシデントコマンダーを担う仕組みづくり | ドクセル

                                オンコール担当が インシデントコマンダーを担う仕組みづくり 株式会社ユーザベース 安藤 裕紀 Incident Response Meetup vol.1 - 2024.1.16(Tue) 00 自己紹介 安藤裕紀 / あんどぅ 株式会社ユーザベース NewsPicks事業 SRE Unit Leader SREチームのマネージャー 兼 テックリード 好きなSREのプラクティス:非難なきポストモーテム文化 特技:AWSコスト削減、障害対応を愚直に100本ノックすること 座右の銘:「質は量から生まれる。逆はない」 ©Uzabase, Inc. All Rights Reserved.

                                  オンコール担当がインシデントコマンダーを担う仕組みづくり | ドクセル
                                • [アップデート] AWS Systems Manager Incident Manager でオンコールスケジュールを管理して、自動でオンコール状態の連絡先をインシデントにエンゲージ出来るようになりました | DevelopersIO

                                  いわさです。 AWS Systems Manager Incident Manager を使うと、検出されたイベントをインシデントとして管理し、解決までの時系列をトレースしたり事後分析したりすることが出来ます。 また、エンゲージメント機能を使うことで、人の介入や承認が必要なタイミングで特定の連絡先を割り当てて通知する機能もあります。 従来は次の記事のように連絡先を管理して、インシデントに直接連絡先をエンゲージメント設定したり、あるいはエスカレーションプランを構成して複数の連絡先を自動でエスカレーションさせることが出来ました。 これまでは、それぞれの連絡先がオンコール状態であるかの管理は出来なかったので、エンゲージメント設定する連絡先やタイミングによってはインシデントの対応スピードに影響が出る場合がありました。 本日のアップデートでオンコールスケジュールという機能が導入されました。 どの時間

                                    [アップデート] AWS Systems Manager Incident Manager でオンコールスケジュールを管理して、自動でオンコール状態の連絡先をインシデントにエンゲージ出来るようになりました | DevelopersIO
                                  • 医療界のオンコール制度はガチでクソなので、即刻廃止すべき【専攻医自殺の続報】 - 有給医のライフハック記録

                                    神戸の専攻医過労自殺の続報 連続100日出勤の原因 法的にはグレー 僕も経験あり 神戸の専攻医過労自殺の続報 「神戸の消化器内科専攻医の過労自殺」の件、続報がありました。 細かい情報は他メディアでの記事を漁ってください。 (煩雑になるのでここでは述べません) やっぱりね。 職場環境と労働環境が、ウンコでしたね・・・。 連続100日出勤とか、 患者押し付けられたりとか、 学会発表の強制とか。 医療界はウンコすぎて、どこから突っ込めばいいのか、 皆目、見当もつかない有り様なのですが・・・。 今回はオンコールという、日本最悪のウンコ制度を斬ります。 連続100日出勤の原因 件の彼が、連続出勤になった最大の原因です。 オンコール制度。 過去の僕の記事にもあるので、そちらもみてくだされば。 まず、 ★「なにかあったら呼ぶので、病院にすぐ来られるトコにいて」 ↑ 百歩譲ってまだわかる。 追加条項もあっ

                                      医療界のオンコール制度はガチでクソなので、即刻廃止すべき【専攻医自殺の続報】 - 有給医のライフハック記録
                                    • エクレア on Twitter: "初期研修医2年間でいちばん 印象に残ってるオンコールこれ https://t.co/daw2gspBjz"

                                        エクレア on Twitter: "初期研修医2年間でいちばん 印象に残ってるオンコールこれ https://t.co/daw2gspBjz"
                                      • PagerDutyを活用したオンコール運用の軌跡

                                        こんにちは! 株式会社ココナラのHead of Informationに任命された ゆーた(@yuta_k0911)です。 PagerDuty Advent Calendar 2023の18日目の記事です! ココナラでは2016年からPagerDutyを使っています。(私が入社する4年も前から・・・) PagerDuty導入以前のオンコール運用や導入後から現在に至るまでどのような利用・工夫をしていて、今後どう利活用しようとしているか?をアドベントカレンダーの記事にしてみます! 私の推し機能も紹介します。 ぜひ、PagerDutyを利用検討中の方もご覧ください! 実は会社名義でアドベントカレンダーに参加するのはこれが初めてです💦 初歩的な内容が多いと思いますが、お付き合いください🙇‍♂ ココナラでのPagerDutyの使い方 PagerDutyを使い始めたのは私が着任する前ですので、想像

                                          PagerDutyを活用したオンコール運用の軌跡
                                        1

                                        新着記事