BASEプロダクトチームブログ

ネットショップ作成サービス「BASE ( https://thebase.in )」、ショッピングアプリ「BASE ( https://thebase.in/sp )」のプロダクトチームによるブログです。

「入門 監視」社内輪読会から1年経過して 〜参加メンバーの意識の変化と今後〜

はじめまして。 BASE株式会社 SRE Groupに所属している富塚(@tomy103rider)です。

先日、弊社CTOが

「もうさばき切れない」アクセスが激増したECプラットフォームにおける負荷対策

https://devblog.thebase.in/entry/bsucon

という記事を公開しました。

社内ではこのアクセス激増をきっかけに「サービスの監視をどうしていくか」「サービス/システムのアラートに対してのアクションはどうあるべきか」といったような監視に関する話題も改めて盛り上がっています。

そんな中でふと1年くらい前にBASE BANK 株式会社の東口 (@hgsgtk)が社内で主催した「入門 監視」輪読会に参加したことを思い出し、その輪読会がどういう会だったかなど、改めて輪読会を振り返ってみようと思います。

「入門 監視」輪読会の目的は何だった?

この輪読会を開催するにあたって主催者がしっかりと残していた社内ドキュメントがあり、そこには以下の3つの目的が書かれていました。

- オーナーズに安定的なサービスを提供したい
- インフラ監視を理解する素地を形成して関心を強める
- アプリケーション監視の素地を形成して関心を強める

「オーナーズのみなさんに安定的なサービスを提供したい」という強い思いを持ち、SRE Groupが主に対応しがちな監視という分野に、いわゆるバックエンドエンジニアも関心を持つ機会にしたかったということが挙げられていました。

どういう形式の輪読会だった?

週に1回、1時間、参加は自由(業務優先)、参加者は開発メンバーやSREメンバーやマネージャーもふらっと参加したりと、わいわいとした雰囲気の会でした。

  • 日時
    • 毎週木曜日 15:00〜16:00
  • 進め方
    • 全12章(付録含む)を各回で2章くらいをもくもく読む
  • タイムスケジュール
    • 30分:当日の対象章を読み、気づき・疑問を共有ドキュメントに書き留める
    • 25分: 書き留めた気づき・疑問を共有・議論
    • 5分:まとめ・次回対象の章を決めて解散
  • 書籍

※当時の実際の様子(こんなこともあろうかと撮っておいた写真)

f:id:tomy103rider:20201002121851j:plain

もくもく読んでいる時間は主催者が心地よい音楽を流してくれていました。こういう雰囲気や環境作りも充実感に繋がる大事なポイントなのだなと感じたのを覚えています。

輪読会から1年以上が経過して・・・

さて、ここまでは輪読会の様子をお伝えしましたが、「輪読会に参加していた人たちがその後何か監視に対する気持ちや行動に変化があったか」という点が一番知りたくなり、

Q. 1年前に実施した入門監視本の輪読会に参加して、その後、監視に対して意識や行動に変化はありましたか?

という質問を参加していた人たちに投げかけ、それぞれの回答をまとめると以下のようになりました。

  • 行動に変化があった
    • 関係ありそうなアラートに対して何かしらアクションをするように心掛けるようになりました。
    • アプリケーション監視のパターンとして Health エンドポイントパターンを知り活用しました。
    • Mackerelでのビジネス監視(とある数値の変化をチェック)を実際に入れてみました。
  • 意識に変化があった
    • Zabbixで監視システムを構築してきた経験があるので、すぐ同様のものを構築してしまいそうになるが、果たしてそれが企業にとって本当にいいことなのかどうかより強く考えるようになりました。
    • 構造化ログにする重要性は、Elasticsearch/Kibanaで可視化する、とか、そこまでいわゆるバックエンドのエンジニアも自分でやると必要性が身にしみてくるなと最近思います。
    • それほど変わってないですが、アプリケーションエラー見直しを考えている中でエラー追跡も監視に入るかなと思っているので参考になったところはあるかもしれないです。
  • 変化はなかった
    • その後も監視に対して特に強いアクションをとれていないと思います。
    • 実務でこの本を意識することは今までなかったと思います。
    • 輪読会を途中離脱してしまい今も積ん読状態です!

その後、何かしらアクションまで起こしている人が3割、意識に変化があった人が4割、特に変化はなかったと思っている人が3割くらいという結果でした。

まとめ

この結果を見ると、輪読会の当初の目的である「関心を強める」という点では半数以上の参加者が何かしらの変化があったと(前向きに)捉えると有意義な会だったのではないでしょうか。

また、私個人としては、過去に他社で運用していた日々のインフラ運用経験から監視について色々知ったつもりになっていましたが、改めて初心にかえって書籍や他のメンバーから学んだことが多かったり、特に「ユーザ視点での監視」の大切さの意識が強くなったのは収穫でした。

とはいえ、今後より良いサービスを提供していくためには、監視や運用についてもまだまだ改善する必要があるというのが現実の組織課題としてあります。BASEのエンジニア組織では監視や運用の面についても更に改善/強化していく計画があり、このあたりの話題は今後計画が進んでいった際に記事が上がるかと思いますのでお楽しみに!