Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
『家族アルバム みてね』で計測しているSLIの事例 / SLI as measured in ...
Search
Isao Shimizu
August 23, 2023
Technology
4
820
『家族アルバム みてね』で計測しているSLIの事例 / SLI as measured in FamilyAlbum
2023/8/23 みんなで考えるシステムの安定運用Night〜信頼性から紐解くこれからの開発〜
Isao Shimizu
August 23, 2023
Tweet
Share
More Decks by Isao Shimizu
See All by Isao Shimizu
Notion x ポストモーテムで広げる組織の学び / Notion x Postmortem
isaoshimizu
1
320
New Relicを活用したSREの最初のステップ / NRUG OKINAWA VOL.3
isaoshimizu
3
1.1k
「家族アルバム みてね」における運用管理・ オブザーバビリティの全貌 / Overview of Operation Management and Observability in FamilyAlbum
isaoshimizu
5
3.3k
約10年間MIXIのインフラを 支えてきたPagerDutyの活用事例 / PagerDuty on Tour 2024
isaoshimizu
6
1.3k
家族アルバム みてねにおけるGrafana活用術 / Grafana Meetup Japan Vol.1 LT
isaoshimizu
2
1.9k
家族アルバム みてねで直面してきた技術的負債 / MIXI KAG 2024
isaoshimizu
18
9.1k
今年1年のEKS運用振り返り/3-shake SRE Tech Talk
isaoshimizu
2
420
ポストモーテムの基礎知識と最新事例 / Fundamentals of Postmortem
isaoshimizu
12
3.3k
全世界1,800万人が利用する「家族アルバム みてね」におけるNew Relic活用法 / FutureStack Tokyo 2023
isaoshimizu
1
610
Other Decks in Technology
See All in Technology
私たち準委任PdEは2つのプロダクトに挑戦する ~ソフトウェア、開発支援という”二重”のプロダクトエンジニアリングの実践~ / 20260212 Naoki Takahashi
shift_evolve
PRO
2
210
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
570
OWASP Top 10:2025 リリースと 少しの日本語化にまつわる裏話
okdt
PRO
3
850
SREのプラクティスを用いた3領域同時 マネジメントへの挑戦 〜SRE・情シス・セキュリティを統合した チーム運営術〜
coconala_engineer
2
780
マネージャー視点で考えるプロダクトエンジニアの評価 / Evaluating Product Engineers from a Manager's Perspective
hiro_torii
0
190
学生・新卒・ジュニアから目指すSRE
hiroyaonoe
2
770
広告の効果検証を題材にした因果推論の精度検証について
zozotech
PRO
0
210
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
GitHub Issue Templates + Coding Agentで簡単みんなでIaC/Easy IaC for Everyone with GitHub Issue Templates + Coding Agent
aeonpeople
1
260
登壇駆動学習のすすめ — CfPのネタの見つけ方と書くときに意識していること
bicstone
3
130
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
340
Amazon Bedrock Knowledge Basesチャンキング解説!
aoinoguchi
0
160
Featured
See All Featured
The SEO identity crisis: Don't let AI make you average
varn
0
330
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
750
The untapped power of vector embeddings
frankvandijk
1
1.6k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
830
Reality Check: Gamification 10 Years Later
codingconduct
0
2k
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
140
sira's awesome portfolio website redesign presentation
elsirapls
0
150
How To Stay Up To Date on Web Technology
chriscoyier
791
250k
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1.1k
Believing is Seeing
oripsolob
1
58
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
190
Into the Great Unknown - MozCon
thekraken
40
2.3k
Transcript
©MIXI 「家族アルバム みてね」 で計測しているSLIの事例 2023/8/23 みんなで考えるシステムの安定運⽤Night〜信頼性から紐解くこれからの開発〜 Vantageスタジオ みてねプロダクト開発部 基盤開発グループ 清⽔
勲
©MIXI About me 清⽔ 勲 @isaoshimizu 2011年〜 株式会社ミクシィ(現MIXI) • 2011年8⽉〜
SNS「mixi」運⽤エンジニア • 2014年4⽉〜 モンスターストライク SRE • 2018年2⽉〜 家族アルバム みてね SRE • 2022年1⽉〜 SREグループ マネージャー • 2023年4⽉〜 基盤開発グループ マネージャー • 週末は社会⼈吹奏楽団での活動(楽団⻑、トロンボーン約30年、たまに指揮者)。 キャンプとクラフトビールが好き。 2
©MIXI ՈΞϧόϜΈͯͶ 3
©MIXI 家族アルバム みてね 4 パパ・ママが撮った⼦どもの写真や動画を、祖⽗⺟や親戚など 招待した家族だけに簡単に共有できる写真・動画共有アプリ フォトブック 写真プリント 商品の例
©MIXI 家族アルバム みてね 5 みてねみまもりGPS みてね出張撮影 みてね年賀状 みてねコールドクター
©MIXI 家族アルバム みてね • 7⾔語・175の国と地域でサービスを提供。海外では「FamilyAlbum」という名称で展開中 • 2023年5⽉、利⽤者数が1,800万⼈※1 を突破 • ⽇本国内ではママやパパの約半数となる47.1%の⽅※2
がご利⽤ 6 ※1 iOS・Android™ アプリ登録者数、ブラウザ版登録者数の合計 ※2「みてね」登録時に⼊⼒されたお⼦さまの誕⽣⽇と厚⽣労働省発表「⼈⼝動態統計」から算出。2022年8⽉時点で47.1%
©MIXI ここから本題
©MIXI 家族アルバム みてね における クリティカル・ユーザー・ジャーニー(CUJ)とは
©MIXI クリティカル・ユーザー・ジャーニー(CUJ) • ユーザーにとって重要な体験 • ビジネス、サービスにとって重要なユーザーの⾏動
©MIXI 「写真・動画をアップロードする」 みてねのCUJの⼀例
©MIXI 写真・動画をアップロードする アップロード 操作 Amazon S3 メディア用バケット 写真・動画がアップロードされることで様々な体験につながる
©MIXI どう計測するか
©MIXI クライアント内 ユーザー アップロード 操作 処理プロセス ① 処理プロセス ② 処理プロセス
③ Amazon S3 メディア用バケット アップロード ログサーバー どこのプロセスで問題が発⽣したかログから把握できる Amazon S3 ログ用バケット S3ログ ログ 写真・動画のアップロードにおけるログ取得
©MIXI 収集されたログからアップロードの成功率を計測する (SLI)
©MIXI ユーザーの端末スペックやネットワーク環境によって 数値が影響を受ける場合もある
©MIXI Amazon S3 ログ用バケット ログを分析してSLIを計測 Amazon Athena Redash 開発者主体で計測、モニタリング
©MIXI ⼀定期間分析して⽬指すべき成功率を決める (SLO) ※これはまだ運⽤できていない
©MIXI 他にも国内・海外のAPIアクセスにおける レスポンスタイム計測の事例も https://team-blog.mitene.us/mitene-infra-multi-region-614717f0162d
©MIXI まとめ l SLIの計測の事例について⼀部ご紹介しました l 各フェーズごとのログ収集からの分析によって、どこで問題が起きているのかわかりやすい l ネットワーク環境など⼀部のユーザー環境によって影響を受けるケースはパーセンタイルを 活⽤するなどして外れ値を除外するとよさそう l
現状SLOは運⽤できていないが、⼀定期間から得られたSLIをもとに仮置きして、⽬標値を 定めていくと良さそう 19