July Tech Festa 2018 @産業技術大学院大学[D10] で発表した際の登壇資料です。 参考文献や細かい記述などを今後修正する場合があります。
![ビッグデータと機械学習の狭間で -データエンジニアに求められる役割-](https://cdn-ak-scissors.b.st-hatena.com/image/square/b48cb915d834ea385114d510f33bdcd9a29bb568/height=288;version=1;width=512/https%3A%2F%2Ffiles.speakerdeck.com%2Fpresentations%2Fa25232df22b244c49969c29cc99098bf%2Fslide_0.jpg%3F10480648)
3日目(最終日)のメモです。各セッションを振り返ったあと、総括をします。 How We Used Kafka to Scale Database Infrastructure LinkedIn内部で使われているドキュメントデータベースであるEspressoについて、Kafkaを使ってデータのレプリケーションをどう行っているかを解説したセッション。 EspressoはバックエンドにMySQLを用いたクラスターデータベースで、以前はデータの可用性を高めるためのレプリケーションをMySQLのレプリケーション機能を用いて行っていた。ただそうするとインスタンス(ノード)ごとのレプリケーションとなり、柔軟性やフェイルオーバー時の負荷の集中などに課題があったので、Kafkaを使ってパーティション単位のレプリケーションにアーキテクチャを変更した、というのがセッションの主旨。 Kafkaを用いて工夫している
先日こんなことを言われた。 「テストを書いた成果を見せよ」 と。 ショッキングだった。 経緯 わたしはいまレガシーなコードに囲まれている。 もちろんテストもほとんどないピカピカのレガシーちゃんである。 レガシーちゃんは「Ctrl+F5 & tail -f 駆動開発」により開発が進められており、日々進化している。 このまま進化をつづけるといつかモンスターになり(もう軽く怪獣っぽいが)、開発スピードがどんどん遅くなり、メンテナンスやバグつぶしでエンハンスとなるような開発ができなくなる。このままじゃマズい...。 こういった事態を一新すべく、手探りながら私含め数人の先輩たちで「DevOps」に取りかかることになった。 バズワードにもなっているが「DevOps」とは、 従来型のシステム管理や調達(ITILを含む)といった、保守的でプロセスを中心に据えた運用からよ>り戦略的でアジャイルな、そして自動
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く