並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 636件

新着順 人気順

infraの検索結果321 - 360 件 / 636件

  • KDDI通信障害は“作業マニュアルの取り違え”から ヒューマンエラーで補償額73億円

    auなどで7月2日に発生した通信障害は、約81時間にわたり合計3043万回線に影響を与えた。KDDIは29日の会見で、障害発生の原因はルーターの設定ミスと説明したが、そのミスが発生したのは、作業マニュアルの取り違えからだった。 「(今回の通信障害は)防がなければならなかったものと思っている。(ルーターの)設定ミス(が原因)と言っているが、作業における指示ミスだった。オペレーターは指示通り作業した」 KDDIの高橋誠社長はそう話した。 障害発生から回復までの流れはこうだ。まず、通信ネットワーク内の中継ルーターをメンテナンスする際に設定ミスが発生。ユーザーが通信する際に発信端末から送られる「位置登録」がルーターに足止めされ、音声通信に使うネットワーク機器「VoLTE交換機」まで正常に届かない状態になった。 これによりルーターとVoLTE交換機の間で位置登録の再送が何度も繰り返され、VoLTE交

      KDDI通信障害は“作業マニュアルの取り違え”から ヒューマンエラーで補償額73億円
    • モバイルゲームの運営を譲り受け「長命化」させるマイネット。彼らはどのようにサービスを移管しているのか?インフラ担当会社ビヨンドと共に内情を明かす - AUTOMATON

      ホーム PR モバイルゲームの運営を譲り受け「長命化」させるマイネット。彼らはどのようにサービスを移管しているのか?インフラ担当会社ビヨンドと共に内情を明かす 全記事PRDevlogインタビュー

        モバイルゲームの運営を譲り受け「長命化」させるマイネット。彼らはどのようにサービスを移管しているのか?インフラ担当会社ビヨンドと共に内情を明かす - AUTOMATON
      • CDN業者にやられた話 - Qiita

        A社の営業 某Webサービスを運用していた時の話。 そのサービスでは広告が主な収入源で、そのためSEOはめちゃめちゃ重要で、SEOの順位と売り上げが比例するような感じでした。 なので、SEOコンサルにずっとアドバイスをしてもらっている状態でした。 そんな時、世界的に有名なCDN業者から営業を受けました。ここでは仮に A社 としましょう。 A社が言うには「パフォーマンス改善で御社の売り上げを倍増される自信があります!」とのこと。 確かにサイトの表示スピードはSEOにもめちゃめちゃ重要ですし、SEO関係なくても、サイトスピードと顧客の購買意欲は比例するとよく言われています。 そうは言っても かなり高額な利用料を 提示されたので、簡単には契約は決断できません。 一旦2週間だけ無償でトライアルさせてもらうことになりました。 トライアルするも トライアルするも、正直体感的にも早くなった感じはなく、ア

          CDN業者にやられた話 - Qiita
        • マルチコンテナ環境を構成するためのオープン仕様「Compose Specification」登場。Docker、AWS、マイクロソフトらが協力して仕様拡張へ

          マルチコンテナ環境を構成するためのオープン仕様「Compose Specification」登場。Docker、AWS、マイクロソフトらが協力して仕様拡張へ Docker社は、同社がDocker Composeとして提供してきた複数のDockerコンテナをまとめて構成する機能の仕様を「Compose Specification」としてオープンな仕様とし、Amazon Web Services(AWS)やマイクロソフトらと協力して拡張していくことを発表しました。 Docker Composeは、2014年にDocker社が買収したOrchard社のマルチコンテナ構成ツール「Fig」を、Docker社が同社のブランドとして製品化し、コンテナオーケストレーションツールのDocker Swarmと同時に2015年2月に公開したソフトウェアです。 Docker Composeを用いると、複数のDoc

            マルチコンテナ環境を構成するためのオープン仕様「Compose Specification」登場。Docker、AWS、マイクロソフトらが協力して仕様拡張へ
          • 「さくらのVPS」のインフラと運用 / How we operate the Infrastructure of Sakura VPS

            「さくらの夕べ ヤンジェネバトル」でお話した内容です。 https://connpass.com/event/146504/

              「さくらのVPS」のインフラと運用 / How we operate the Infrastructure of Sakura VPS
            • Nature Remoの裏側 ~ AWSとWeb技術をIoTの世界でフル活用する / Inside Nature Remo

              Nature Remoの裏側 ~ AWSとWeb技術をIoTの世界でフル活用する / Inside Nature Remo

                Nature Remoの裏側 ~ AWSとWeb技術をIoTの世界でフル活用する / Inside Nature Remo
              • 運用の考え方は「システム管理」から「サービス管理」へ ITIL4で変わってきた、運用者に求められること

                インフラエンジニア向けの書籍を取り上げ、著者と出会い、楽しく本を知り、仲間を作る場所である「インフラエンジニアBooks」。ここで、『運用改善の教科書』の著者である近藤氏が登壇。続いて、ITIL4の登場に伴う運用の考え方の変化と、昨今の運用に求められていることを紹介します。前回はこちらから。 2019年頃に起きた運用の変化 近藤誠司氏(以下、近藤):みなさん運用をやっている方が多いということで、ご存知のITIL(Information Technology Infrastructure Library)のv3、シラバス2011をベースにしたものを貼っています。いろいろとプロセスや機能などがあって、分類がありました。 シラバス2011、ITIL v3の時点では、基本的にはサービスストラテジが戦略を練る、サービスデザインは設計するというところです。トランジションは、設計したものを作って移行する

                  運用の考え方は「システム管理」から「サービス管理」へ ITIL4で変わってきた、運用者に求められること
                • VPSを解約してFirebase Hostingにブログを移した | おそらくはそれさえも平凡な日々

                  タイトルの通り。なんとなく自分のサイトを自分で運用したいと思っている。それはWebエンジニアとしてのポートフォリオ的な側面もあるし、それに加えて、自分の書いた文章を自分の管理下におきたい欲求があるのだと思う。 サブブログを、はてなブログに持っていますが(https://blog.song.mu)、これもまた、コンテンツはblogsync を使って管理しています。 このサイトはもともとVPS上のNginxから静的配信されており、 VPS上のgit bareリポジトリに直接push post-receive Hook で riji を呼び出してサイト再構築 という結構カッコいいフローを組んでいて 、これがなかなか気に入っていた。以下のような点が良かった。 国内のVPSへのgitリポジトリへのpushはかなり早い GitHubへのpushに少し引っかかりを感じるレベル とはいえコンマ数秒程度の違

                    VPSを解約してFirebase Hostingにブログを移した | おそらくはそれさえも平凡な日々
                  • 伝統的なエンプラ企業で取り組むインフラの設計書のモダナイゼーション.pdf

                    モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察� ~Text-to-MusicとText-To-ImageかつImage-to-Musicを例に~

                      伝統的なエンプラ企業で取り組むインフラの設計書のモダナイゼーション.pdf
                    • CircleCI 2.0を支える2つの コンテナクラスターとSRE

                      CNDT 2019の登壇資料

                        CircleCI 2.0を支える2つの コンテナクラスターとSRE
                      • Kubernetes上でサーバレス環境を実現する「KEDA」がCNCFのプロジェクトに採用。サーバレスの標準化は進むか

                        Kubernetes上でサーバレス環境を実現する「KEDA」がCNCFのプロジェクトに採用。サーバレスの標準化は進むか マイクロソフトとRed Hatが中心となって開発してきた「KEDA」(Kubernetes Event-driven Autoscaling)が、Cloud Native Computing Foundation(CNCF)のプロジェクトに採用されたことが発表されました。 CNCFはKubernetesをはじめとするクラウドネイティブのためのオープンソースソフトウェア開発をホストする団体です。 KEDAは、Kubernetesのうえでイベントドリブンなオートスケールを実現することで、コンテナを用いたサーバレスコンピューティングの仕組みを提供するソフトウェア。 Kubernetesにも、オートスケール機能がありますが、これはCPUやメモリの負荷に反応してコンテナのスケールア

                          Kubernetes上でサーバレス環境を実現する「KEDA」がCNCFのプロジェクトに採用。サーバレスの標準化は進むか
                        • クラウドのシステム運用技術に機械学習を応用する研究 / CLOUD AI

                          第6回さくらインターネット研究会

                            クラウドのシステム運用技術に機械学習を応用する研究 / CLOUD AI
                          • Google Cloud、Dockerコンテナをサーバレス化するCloud Runの第二世代実行環境が正式版に。すべてのLinuxの機能と互換、ファイルサーバへのマウントも可能

                            Googleは、Dockerコンテナをサーバレスで実行するCloud Runの第二世代実行環境と、Cloud Runの新機能であるCloud Run Jobsが正式版になったことを明らかにしました。 Cloud RunはHTTPSリクエストをトリガーとしてDockerコンテナを実行するサーバレス基盤です。 すなわち、HTTPリクエストがない場合にはDockerコンテナは起動されず、HTTPリクエストに応じて自動的に多数のコンテナが起動するスケーラビリティが特長です。Dockerコンテナであれば、どんな言語で作られたサービスであっても関係なく利用できる柔軟さを備えています。 課金もおよそ100ミリ秒ごとに、起動しているサービス数などによって計算されます。 Cloud RunはKubernetes上でサーバレスコンピューティング環境を実現するフレームワークとしてGoogleがオープンソースで開

                              Google Cloud、Dockerコンテナをサーバレス化するCloud Runの第二世代実行環境が正式版に。すべてのLinuxの機能と互換、ファイルサーバへのマウントも可能
                            • Herokuの無料枠が廃止になるのでDeta.shへ移行する - Qiita

                              追記(2023/3/11) 約半年ほどDeta.shで簡単なサービスを運用していたが、先日Deta.shに大幅なアップデートがあり、仕様が大きく変わった。 これによりREST APIを公開して運用することができなくなった。(できなくはないが必ずヘッダにAPIキーを指定する必要がある。そのため例えばLINE Messaging APIのバックエンドとしては使用不可) Detaは”Personal Cloud”を思想に掲げているらしく、何らかのサービスのバックエンドとして使うにはちょっと使い勝手が悪くなってしまった。 というわけで、自分の使い方には合わなくなったため現在はAWSへ移行している。 HerokuのFree Planが終了するらしい(泣) Starting November 28, 2022, we plan to stop offering free product plans a

                                Herokuの無料枠が廃止になるのでDeta.shへ移行する - Qiita
                              • Puppet、ローコードで運用監視やDevOpsを自動化する「Relay」を正式リリース。AWSやAzure、Terraform、Slack、JIRA、DataDogなど多数のツールをイベントドリブンに連携

                                Puppet、ローコードで運用監視やDevOpsを自動化する「Relay」を正式リリース。AWSやAzure、Terraform、Slack、JIRA、DataDogなど多数のツールをイベントドリブンに連携 Puppetは、DevOpsや運用監視を実現するうえで関連するさまざまな関連サービスをローコードで連携させ、作業の自動化を実現する新サービス「Relay」の正式リリースを発表しました。 Relay is here. Puppet's #cloudnative workflow #automation platform is now generally available! Ditch the digital duct tape and get started with Relay: https://t.co/8xUgPihitr pic.twitter.com/aWc2edp0fP —

                                  Puppet、ローコードで運用監視やDevOpsを自動化する「Relay」を正式リリース。AWSやAzure、Terraform、Slack、JIRA、DataDogなど多数のツールをイベントドリブンに連携
                                • Java, MySQLをKotlin, PostgreSQLに移行した - k0kubun's blog

                                  7年前にGitHub Rankingというサービスを作り、APIを叩きすぎてGitHubからの風当たりが強くなって*1からはデータの更新を止めていたが、KubernetesやGraphQLの時みたいに技術を試す砂場用に惰性で動かし続けていた。 Issueの機能要望対応が段々面倒になってきて、サーバー代節約のために潰すかと考えていたのだけど、毎日1000PVくらいあるので試しにGoogle Adsenseを設置してみたところ1日平均 $1 くらいは入ってて黒字になりそうだったので、ちょっとメンテしやすくしてデータの更新再開するかー、ということで今回いろいろ綺麗にした。 DB: MySQL → PostgreSQL なぜPostgreSQLにしたのか 個人的には多くの用途ではMySQLとPostgreSQLどっちでもいいと思っているんだけど、今所属してるチームがメンテしてるサービスのDBの多く

                                    Java, MySQLをKotlin, PostgreSQLに移行した - k0kubun's blog
                                  • 5歳娘「パパ、レンタルサーバを契約しないで?」 - Qiita

                                    無職ワイ、システム開発会社の面接を受ける 面接官「よろしくお願いします」 ワイ「よろしくお願いします」 面接官「JavaScriptがお得意みたいですが」 面接官「サーバサイドですか?フロントですか?」 ワイ「フロントです」 ワイ「高卒で、18歳からフロントやってました」 面接官「おお〜、大ベテランですね」 ワイ「(フロントいうても、カラオケ店のフロント業務やけどな・・・)」 ワイ「(でも、嘘は言うてへん・・・!)」 面接官「では、サーバサイドの経験はどうですか?」 ワイ「サーバ側もよく触ってました」 ワイ「(ビールサーバとウォーターサーバを触ってたで)」 面接官「頼もしいですね」 面接官「インフラとかはどうですか?」 ワイ「インフラも一通り任されてました」 ワイ「(カラオケ屋の新店舗ができるとき、電気と水道の手続きはワイが任されたんや)」 面接官「インフラもいけるんですね」 面接官「もし

                                      5歳娘「パパ、レンタルサーバを契約しないで?」 - Qiita
                                    • クラウドネイティブとKubernetes(だいたいあってるクラウドネイティブ)

                                      社内のウェビナーで使用した資料をほぼそのまま掲載しました。 クラウドネイティブをふわっとわかったつもりになる、考え方の入り口を見つけることを補助するための初心者向け資料です。 具体的な技術は一切解説しませんし、「良い」評価と「悪い」評価も真っ二つだったので人を選ぶ資料であることを先に述べておきます。

                                        クラウドネイティブとKubernetes(だいたいあってるクラウドネイティブ)
                                      • 緊急性が高い障害対策の専門チームで学んだ、緊急案件対応の傾向と対策

                                        以前、マイクロソフトのサポート部門で緊急性が高い障害対応の専門チームとして活動していた時期がありました。その時の経験から、緊急案件の対応方法についてまとめてみました。 「緊急性が高い障害」とは具体的にどのようなケースか? 緊急案件として対応を依頼されるケースとしては、以下のようなパターンが多いと思います。 停止することで日々の業務オペレーションに甚大な影響を与える社内システム。例えばメールや商品の受発注など。 停止することで社会的な影響が大きいシステム。例えば社会インフラ、医療系など。 停止することで売り上げのロスに直接影響するシステム。例えばオンラインショップなどの E コマース。 こういった緊急案件では数時間以内での解決を求められます。よくある目安としては、障害発生から 2 ~ 4 時間以内に解決することを目標として対応することが多いように思います。 緊急案件対応のゴールとは何か? 緊

                                          緊急性が高い障害対策の専門チームで学んだ、緊急案件対応の傾向と対策
                                        • 顧客に無断でスマホ契約、ソフトバンク代理店で発覚 本社は事実認め謝罪 「不適切行為があった」

                                          ソフトバンクは7月12日、業務委託した代理店の一部スタッフが顧客の個人情報を不正利用し、無断でスマートフォンの契約を結んでいた問題があったことを認め、謝罪した。同社は「該当のお客さまには誠意をもって対応をしたい」と話している。 Twitterでは7月11日、あるソフトバンク回線利用者の「携帯料金が過剰請求されてる事に気付いた」というツイートが話題となっていた。投稿者によると、機種変更をした日付に契約した覚えのないスマートフォンが自身の名義で契約されており、過剰に利用料金を請求されたという。 契約した店舗に問い合わせしたところ、確かにスマートフォンを契約した記録があり、スマートフォン本体も渡していると返答。その後投稿者は、警察や消費者センター、ソフトバンク本社へも問い合わせを進める中で、契約店舗が「担当者が個人情報を不正利用し、スマートフォンの契約・解約を無断で行ったことを認めた」と投稿して

                                            顧客に無断でスマホ契約、ソフトバンク代理店で発覚 本社は事実認め謝罪 「不適切行為があった」
                                          • 運用設計の教科書 ~現場で困らないITサービスマネジメントの実践ノウハウ

                                            この本の概要 提供を開始したサービスが終了するのは4年後かもしれませんし,20年後かもしれません。場当たり的な運用を行っていては,いずれ限界がくることは想像に難くないかと思います。能率アップのために導入したシステムが,稼働させたらトラブルが多発し,結果としてコスト増や品質の低下を引き起こす……。そんな事態を防ぐための運用設計のノウハウを,ITILベースの運用オペレーションのプロとして定評のある著者らが体系化した一冊。 こんな方におすすめ システム運用設計担当者,運用担当者,インフラエンジニア 著者プロフィール 近藤誠司(こんどうせいじ) 1981年生まれ。運用設計,運用コンサルティング業務に従事。オンプレからクラウドまで幅広いシステム導入プロジェクトに運用設計担当として参画。そのノウハウを活かして企業の運用改善コンサルティングも行う。 趣味は小説を書くこと。第47回埼玉文学賞にて正賞を受賞

                                              運用設計の教科書 ~現場で困らないITサービスマネジメントの実践ノウハウ
                                            • 社労士向けクラウド「社労夢」障害、発生からまもなく1カ月 6月料金請求なしで売上高予想32億円→未定に

                                              社会保険労務士(社労士)向けクラウドサービス「社労夢」などで6月5日以降システム障害が続いているエムケイシステム(大阪市)は29日、2024年3月期通期連結業績予想を修正した。6月分のサービス利用料を請求しないため、収益が激減。もともと約32億円を見込んでいた売上高、2.6億円を見込んでいた営業利益はいずれも「未定」となった。 エムケイシステムはランサムウェアを使ったサイバー攻撃により、サービス提供用のサーバが暗号化された。社労夢に加え、人事労務向けサービス「DirectHR」などの9サービスが影響を受けており、29日の時点でも完全復旧はできていない。 約3400いるユーザーに正常なサービスを提供できないため、6月分の請求は停止。調査や復旧、再発防止にかかる費用は今後も増加する可能性があり、業績予想が立たない状況になっている。 このシステム障害により、サービスを導入する社労士法人や民間企業

                                                社労士向けクラウド「社労夢」障害、発生からまもなく1カ月 6月料金請求なしで売上高予想32億円→未定に
                                              • 1日500円で、LTEデータ通信が車内で使い放題、車載専用Wi-Fiルーター「DCT-WR100D」、パイオニアが12月発売 料金は30日なら1500円、365日では1万2000円

                                                  1日500円で、LTEデータ通信が車内で使い放題、車載専用Wi-Fiルーター「DCT-WR100D」、パイオニアが12月発売 料金は30日なら1500円、365日では1万2000円
                                                • Kubernetesを拡張して日々のオペレーションを自動化する

                                                  Cloud Native Days Tokyo 2019

                                                    Kubernetesを拡張して日々のオペレーションを自動化する
                                                  • Google - Training Site Reliability Engineers

                                                    Training Site Reliability Engineers: What Your Organization Needs to Create a Learning Program Written by: Jennifer Petoff, JC van Winkel & Preston Yoshioka with Jessie Yang, Jesus Climent Collado & Myk Taylor Providing training and education for Site Reliability Engineers is universally important to set them up for success in your organization. However, the specific training needs of each enginee

                                                    • ネットワークは宣言的になりえるか - LGTM

                                                      2020-07-08 追記 はじめに Kubernetes などのコンテナオーケストレーターとの対比によって、ネットワークの世界でも同じように制御できないか注目されています。Cisco、Apstra、VMWare などが言う "Intent Based Networking" や "Closed Loop Automation" も同じものを指していると思われます。宣言的ネットワーキングは「あるべき状態の維持をプロトコルやソフトウェアに任せられるかもしれない」という点で運用上のメリットがあります。 以前所属していた国際Tier1 ISP *1 で、Kubernetes ほど洗練されてはないものの コンセプトとしてはこれを実践していたり、現在もネットワーク自動化の取り組みの中でゴールをここに設定したりしています。 このエントリーでは、 宣言的ネットワーキングとは何なのか 従来のネットワーク運

                                                        ネットワークは宣言的になりえるか - LGTM
                                                      • Blue/Green デプロイを使用した、RDS MySQL/PostgreSQLのアップグレード

                                                        TL;DR RDS の メジャーバージョンアップグレード を行なった PostgreSQL 11.6 -> 15.5 MySQL 5.7.44 -> 8.0.36 PostgreSQL は AWS CDK を利用した、自前での手動切り替えをベースにした Blue/Green デプロイによるアップグレードを行なった MySQL は AWS コンソールから AWSが提供している機能である RDS Blue/Green Deployments による MySQL のアップグレードを行なった nginx の ngx_http_proxy_module を活用してサービスのダウンタイムを防止した はじめに 初めまして。株式会社ジーニーの GENIEE CHAT開発チームのマネージャーを担当しています。 今回は、データベースのメジャーアップグレードを行った際の手順やポイントなどを書いていこうと思います

                                                          Blue/Green デプロイを使用した、RDS MySQL/PostgreSQLのアップグレード
                                                        • メルペイのシステム運用とPlaybookの共通管理への挑戦 | メルカリエンジニアリング

                                                          こんにちは、メルペイでSREとして従事している @myoshida です。この記事は Merpay Tech Openness Month 2021 の8日目の記事です。 SREチームはお客さまへよりよいサービス利用体験を提供するため、日々様々な改善活動に取り組んでいます。その活動の一環としてPlaybookの概念を導入し、運用者の運用負担を減らす取り組みを始めました。今回はそのことについて説明してみたいと思います。 概要 メルペイではアプリケーションエンジニアとSREの双方がオンコール制度のもと運用に携わっています。 運用の悩みは様々ですが、そのうちの1つに手順書の取り扱いがあります。 どこに置くべきか、更新はされているのか、何を書けばいいのか、どの場面でどの手順書を利用すればよいのかというような悩みはどこの現場でも少なからず存在すると思います。 そこで、Playbookと呼ばれる体系的

                                                            メルペイのシステム運用とPlaybookの共通管理への挑戦 | メルカリエンジニアリング
                                                          • Serverless Framework & DockerによるローカルフレンドリーなLambda開発・運用

                                                            会社のチームメンバーにLambdaの開発・デプロイ方法について共有するために書いた記事ですが、Lambdaを触ったことない人にも有益そうな内容なので、Zennに投稿してみました🙏 今回作りたいLambda 指定したS3バケットに画像がアップロードされたら、リサイズして同じまたは別のS3バケットにアップロードする 完成リポジトリ https://github.com/samuraikun/image-resizer-lambda-serverless Runtime Ruby2.7 前準備 AWSアカウントが作成済み、AWS CLIインストール済み アクセスキーIDとシークレットアクセスキーを事前に設定する必要あり Serverless Framworkについて Lambdaをデプロイするまでに必要な各設定を簡単にできるツールです。 他にも、AWS公式のSAMやTerraformなど他のl

                                                              Serverless Framework & DockerによるローカルフレンドリーなLambda開発・運用
                                                            • ECS用のCDパイプラインに対する考察

                                                              それでは、1パターンずつ構成を確認していきます。 1. 全部GitHub Actionsでやる GitHub Actionsでパイプライン全体を構築する場合は、以下の図のような構成になります。 ちなみに、GitHubのDeploymentsを使用することで、Slackと組み合わせてのChatOpsや、任意のコミットのデプロイを実行などいろいろと便利になります。 ですが、Deployments APIをパイプラインで利用するには、Actionsのトリガーの条件を変えたり、ECSへのデプロイの成否に応じてAPIを使ってDeploymentのステータスを更新したりする処理が必要になり、少々パイプラインが複雑化してしまいます。 なので、今回の趣旨とちょっとずれているため、各パターンには記載していません。 では、以下で処理を順に説明していきます。 Image Build 図中の Build Imag

                                                                ECS用のCDパイプラインに対する考察
                                                              • 実務で使う固有表現抽出 / Practical Use of Named Entity Recognition

                                                                ■イベント 
:自然言語処理勉強会 https://sansan.connpass.com/event/190157/ ■登壇概要 タイトル:実務で使う固有表現抽出 発表者: 
DSOC R&D研究員 高橋 寛治 ▼Twitter https://twitter.com/SansanRandD

                                                                  実務で使う固有表現抽出 / Practical Use of Named Entity Recognition
                                                                • ISUCON10 本選問題の解説と講評 : ISUCON公式Blog

                                                                  こんにちは、ISUCON10 の本選出題を担当した白金動物園の mirakui です。最近はパン作りにハマっています。この記事では、本選問題であるアプリケーションの「XSUCON」について、問題の概要と想定していた解き方について解説していきたいと思います。 XSUCON とは近年の ISUCON にはとても多くの方が参加してくださり、スコアランキングを表示したりベンチマーカー実行を指示したりするいわゆる「ポータルサイト」の負荷対策には毎年の出題担当たちが苦労してきました。記念すべき 10 回目の開催である ISUCON10 ではぜひこの ISUCON ポータルサイト自体を問題にしたい、と私たち白金動物園が1年前から温めてきた構想を形にしました。 というわけで ISUCON10 の本選問題は「XSUCON」という、 ISUCON を模した仮想的な競技のポータルサイトでした。XSUCON の世

                                                                    ISUCON10 本選問題の解説と講評 : ISUCON公式Blog
                                                                  • Google Cloud、運用監視のメトリクスデータを自在に操作できる「Monitoring Query Language」(MQL)正式リリース

                                                                    Google Cloud、運用監視のメトリクスデータを自在に操作できる「Monitoring Query Language」(MQL)正式リリース Google Cloudは、運用監視のマネージドサービスであるGoogle Cloud Monitoringの時系列データに対して操作が可能な問い合わせ言語「Monitoring Query Language」(MQL)の正式リリースを発表しました。 これまでGoogle Cloud Monitoringでは収集した運用監視データに対してダッシュボードのメニューから設定を行うことで、グラフなどデータの視覚化やアラームの設定、フィルタリングなどを行っていました。 Monitoring Query Languageを用いることで、これらをすべてコードとして組み立て、表現できるようになり、より柔軟性の高い運用監視が可能になります。 ダッシュボードにQ

                                                                      Google Cloud、運用監視のメトリクスデータを自在に操作できる「Monitoring Query Language」(MQL)正式リリース
                                                                    • Cloud Runは便利!GCPの月額費用を4万円以上節約した話 - Qiita

                                                                      g4というサービスを運営しているのですが、ここ数ヶ月間でGCPの月額費用を4万円以上節約したので、経緯を書いておきます。 7月の費用 ¥53,818 9月の費用 ¥18,801 詳しくはこちらのレポート 11月の費用 ¥7,333 詳しくはこちらのレポート 5月はこんな感じでした。 完全にやらかしてますね!!敗因は 無料期間なのもあり利用料金気にせずに使っていた そして無料期間の終わりを忘れていた アラートを設定していなかった です。 まずは、 7月の費用から約3万円節約するために、GAEのオートスケール周りの設定を見直しました 7月の状態は 本番: (GAE flexible/custom cpu x 2) x 2台 ステージング: (GAE flexible/custom cpu x 2) x 2台 (DBに関しては本番とステージングで同じインスタンスを使っています) でした。これは、

                                                                        Cloud Runは便利!GCPの月額費用を4万円以上節約した話 - Qiita
                                                                      • 「Platform Engineeringへの招待」、開発者の生産性を高めるプラットフォームを作り、運営していくための考え方とは(前編)。Platform Engineering Meetup #1

                                                                        急速に注目を浴びつつある新しいムーブメント「Platform Engineering」についてのコミュニティイベント「Platform Engineering Meetup #1」が3月9日に都内でオンラインとオフラインのハイブリッドで開催されました。 Platform Engineeringとは、クラウドネイティブ時代においてソフトウェアエンジニアリング組織にセルフサービス機能を提供するためのツールチェーンやワークフローを設計し構築する技術分野とされています。 その最初のセッションとして行われた、イベントの主催者である草間一人氏の「Platform Engineeringへの招待 - Platform Engineeringって何? 何故今注目なの?」の内容を紹介しましょう。 記事は前編と後編に分かれています。いまお読みの記事は前編です。

                                                                          「Platform Engineeringへの招待」、開発者の生産性を高めるプラットフォームを作り、運営していくための考え方とは(前編)。Platform Engineering Meetup #1
                                                                        • GCP のログ大全2019

                                                                          この記事は Google Cloud Japan Customer Engineer Advent Calendar 2019 の 5 日目の記事です。 GCPにおけるログのライフサイクルGCPにおけるログのライフサイクルは、収集・集約・活用・保管の大きく4つのフェーズに分類できると考えております。まずそれぞれのフェーズの中でどのようなことができるのか、皆様に知っておいておきたいことについて説明します。 収集フェーズログを発生させる元のシステムから集めてくるフェーズです。ログの発生元がどこであれ、最終的には Stackdriver の Logging API にログを送ることで収集を行います。もちろんGCPのサービスで発生するログは自動的に収集されますが、GCP上のユーザアプリケーションのログや、オンプレミスや他クラウド環境からのログは、Logging エージェントかLoggin APIの

                                                                            GCP のログ大全2019
                                                                          • 【保存版】Google アナリティクスで重要な4+10=14個の設定チェックリスト|平岡 謙一

                                                                            みんな大好き、Googleアナリティクス。 導入時に必要な初期設定をtweetしたら、多くの反応をいただけました。140文字では伝えきれなかったことを、紹介しようと思います。 Google Analyticsで必要な11個の初期設定 ・Search Console連携 ・Google広告と連携 ・オリジナルビューをコピー ・indexページの正規化 ・クエリパラメータ除外 ・サイト内検索トラッキング ・コンテンツグループ定義 ・目標設定 ・関係者除外フィルタ作成 ・各種レポート有効化 ・クリックイベント — 平岡謙一@マーケティング顧問 (@shizuoka_hira) May 19, 2020 Google アナリティクスを使う際には、2ステップにて設定確認するといいです。データ取得のための事前準備。データを集計するためのルール設定。この順番にて、 ①時系列に沿って、必要な初期設定をチェ

                                                                              【保存版】Google アナリティクスで重要な4+10=14個の設定チェックリスト|平岡 謙一
                                                                            • 利用者にAdmin権限委譲しても大丈夫 ニフティがAWS導入時から行ってきたマルチアカウント管理法

                                                                              AWSを活用する複数社が集まり、事例を共有する祭典「AWSマルチアカウント事例祭り」。第2回の今回は、ニフティ株式会社の石川氏が自社へのAWS導入と管理方法について話しました。 ニフティがAWSをどう管理しているか 石川貴之氏(以下、石川):「AWS導入から3年 AWSマルチアカウント管理で変わらなかったこと変えていったこと」という題でお話しします。まずは自己紹介です。 ニフティ株式会社の基幹システムグループにいる石川貴之です。担当業務はAWS/GCPの管理、Atlassian製品の管理、Webサービスのバックエンドを担当しています。 少しだけ会社紹介もしたいと思います。ニフティ株式会社は@nifty光を始めとする、ネットワークサービス事業と、@niftyニュースのようなWebサービス事業。グループ会社で、不動産などの行動支援プラットフォーム事業を営んでおります。「ニフティなんだからニフク

                                                                                利用者にAdmin権限委譲しても大丈夫 ニフティがAWS導入時から行ってきたマルチアカウント管理法
                                                                              • 監視とオブザーバビリティ 〜 悩む前に確認しておくべきこと / 20230926-ssmjp-monitoring-and-observability

                                                                                2023年9月26日開催の「ssmonline #37」での発表「監視方法論」のうち、一部を抽出して公開しました。 当日ツッコミ枠でご参加いただいたみなさん、ご視聴いただいた皆様ありがとうございました。

                                                                                  監視とオブザーバビリティ 〜 悩む前に確認しておくべきこと / 20230926-ssmjp-monitoring-and-observability
                                                                                • [レポート] オペレーション、監視(Monitoring)、可観測性(Observability)… AmazonのCTOはAWS re:Invent 2020のキーノートでどう語ったか? キーワードを拾ってみた #reinvent | DevelopersIO

                                                                                  昨年12/18(日本時間では12/19)、AWS re:Invent 2020におけるのDr. Werner Vogels(ヴァーナー・ボーガス氏)のキーノートは皆さんご覧になられたでしょうか。 氏のキーノートセッションは毎回恒例ですが、例年だと開発環境や実行環境・AWSインフラについての話にフォーカスがあたっている印象でした。その中で「Everything fail, all the time」や「You build it, You run it」のような名言・格言が語られてきました。 ところが今回は「Developer Keynote」と銘打った上で、よりオペレーション段階の話に長く時間が割かれました。MLやインフラに特化したキーノートが別にあったことも要因のひとつでしょう。 どんなことが語られたのか? 個人的に気になったキーワードをひろってみました。 なお記事中の訳は基本的にぼくの解

                                                                                    [レポート] オペレーション、監視(Monitoring)、可観測性(Observability)… AmazonのCTOはAWS re:Invent 2020のキーノートでどう語ったか? キーワードを拾ってみた #reinvent | DevelopersIO