概要
LINEヤフー株式会でゆるSRE勉強会 #12 が開催されたので感想を書いたものです。
セッションの感想
会場スポンサーLT :『オブザーバビリティコミュニティの近況報告』
Masaki Sugimoto さん(id:msksgm)の発表。友人の会社がスポンサーしてたのと LT すると聞いたので今日のゆるSRE会に参加しよう決意したようなものでした。いつもありがとう。
改めて OpenTelemetry 公式ドキュメント翻訳プロジェクトの話を聞いた。1回だけコントリビュートしたっきりまだ2回目をやってないので、そろそろもう一度翻訳にチャレンジしてみようと思えた。
Observability Conference Tokyo 2025 は O11y Con Tokyo と書いてオリコン東京と略して読むらしい。CFP は 8/24 までなのでこちらも挑戦しておきたい。
『技術的負債で信頼性が限界だったWordPress運用をShifterで完全復活させた話』
Adachi.Ryoさんの発表。
移行系の話はいつも聞くとヒリヒリしますが、今回は元が WordPress なこともあって余計ヒリヒリした。Shifter を知らなくて発表を聞きながら裏で調べていたが WordPress の SaaS のようなものらしい。
また開発環境の構築に justfile というものを利用して自動化したと言った話があったが、こちらも初耳だった。どうやら make のようなもののことらしい。
昔ハッカー飯で Lightsail を使って運用してた時期があったけど、細かい作業ができなかったりする(例えば IAM ロールをアタッチしたりすることができない)ので、Shifter への移行は良い取り組みだなと思いました。
『Enablingについに成功した話』
ササキさんの発表。
学習の4段階フレームワークというのを初めて知った。
- 第1段階: 知らないからできない(SREの概念を知らない)
- 第2段階: 知っているけどできない(SREについて知っているが実践方法がわからない)
- 第3段階: 意識すればできる(意識的にSRE活動ができる)
- 第4段階: 無意識でもできる(自然とSRE活動ができる)
Enabling SRE をやっていく上でこういった指標を持って活動すると、今組織がどんな状態で何をするべきなのかを意識できそうで良さそうと思いました。
また、「SREじゃん」スタンプを導入して、小さな SRE 活動も認識できる文化を作ったという話は本当に良かった。自分がやった活動が SRE として認めらるって良いですよね。こういった活動のおかげでモチベーションが上がりそうだと思いました。もし自分が同じような立場になったら真似したいです。
『EOLを迎えたベースイメージで動く属人化したnginxプロキシを無停止移行した話』
すみやさんの発表。
退職予定者が作成したブラックボックスなものをどうやって紐解いていったかといった話だった。未知なものに対して各々で調査を行い、構成図を作成したという話は今度私も試してみようと思えました。
懇親会で少し登壇者の方とも話しましたが、退職者予定者の方に聞く前に何故自分たちで調査を行なったのかを聞いたところ、正解を先に知ると引き継ぎを行う際に疑問点に気づかない可能性があるというとても良い話を聞けました。実際に発表でも触れられていましたが、前提となっていた構成を疑いシンプルなものに変更することが出来たという話は、こういった事前の努力があってこそだと思いました。
『o11yツールを乗り換えた話』
福本隆弘さんの発表。
D から N に乗り換えた話しでした。コスト面で乗り換えたくなる気持ちは分かるけど、古い PHP のシステムでは D の APM が機能しなかったという話は興味深かった。グラフの丸め方や表示方法がツールによって異なったりするので大変だったとは思うのですが、以降が無事に完了しコスト削減や APM の利用ができるようになったという話はとても良かった。
『LLM機能を支えるLangfuse/ClickHouseのサーバレス化』
上原 佑介さんの発表。
Langfuse はプロンプトのバージョン管理やモデルの検証比較、LLM 実行結果のトレースを記録できるプラットフォームとのこと。これを AI レビュー計測基盤として利用したというお話がまずありました。Langfuse は名前とざっくりとした内容ぐらいしか知らなかったので、スライドでしっかり説明があったのはありがたかったです。
また、Langfuse のトレース結果などは ClickHouse に格納したといったお話をもありました。ClickHouse は列指向データベースなので AWS や Google Cloud でいうところ Redshift や Google BigQuery に相当するものらしい。一番決定的に違うのは ClickHouse は OSS であるところなのかな。
ClickHouse を ECS で構築しようとした時、各サービスは 1 サーバー 1 ECSサービスとして作成する必要があったり、ClickHouse の書き込みデータ先である EFS のスループットモードが Bursting になっているせいでボトルネックなっていたという現場で起きたリアルの話を聞けたのは良かったです。
『新卒がSRE作ってみた』
ひびきさんの発表。
初登壇とは思えないほど堂々と話してて見習いたいなと思いました。新卒でもう SRE チームのリーダーを任されているのもすごい。
組織に新しい風を吹かして SRE 文化を醸成していったという話で、これを 1 人でやったのは自分にとっても良い刺激になりました。
勉強会の全体的な感想
ゆるSRE勉強会は配信がないので、なかなか表には話せないようなリアルな話を今回も沢山聞けて勉強になりました。次回はネタがあれば自分も登壇をしてみたいです。運営の皆さんありがとうございました。