IT用語: SRE(サイト信頼性エンジニアリング)とは|Googleが考案した運用手法
ソフトウェアエンジニアリングの手法で運用を改善するSREの概念とSLI・SLO・SLAの関係を解説。
SRE(Site Reliability Engineering)とは
SREはGoogleが考案した、ソフトウェアエンジニアリングの手法で運用の問題を解決するアプローチです。「信頼性を保ちながらいかに速くリリースするか」のバランスをエンジニアリングで最適化します。
重要な指標
| 用語 | 意味 |
|---|---|
| SLI(Service Level Indicator) | 実際の信頼性を示す指標(例: 99.5%の可用性) |
| SLO(Service Level Objective) | 目標値(例: 可用性99.9%を目指す) |
| SLA(Service Level Agreement) | ユーザーとの契約(例: 99.5%未満なら返金) |
エラーバジェットとは
SLOとSLAの差分が「使える障害の余裕(エラーバジェット)」です。例えばSLO 99.9%なら月約43分の障害は許容範囲。バジェットが残っている間は積極的にリリースし、使い切ったら安定化を優先するという判断軸になります。
DevOpsとSREの違い
DevOpsが文化・哲学的な概念であるのに対し、SREはGoogleにおけるDevOpsの具体的実装形態です。「開発者と運用者の協力」を達成するための方法論の一つです。
関連する用語 (DevOps)
全58件を見るECR
Amazon Elastic Container Registryの略。AWSが提供するフルマネージドなDockerコンテナレジストリ。ECSやEKSと密に統合されており、IAMポリシーでアクセス管理できる。
ArgoCD
Kubernetesのための宣言的GitOps継続デリバリーツール。Gitリポジトリ上のマニフェストと実際のK8sクラスタの状態を常に同期させる。変更を検知して自動でデプロイする。
Terraform
HashiCorpが開発するIaC(Infrastructure as Code)ツール。HCL(HashiCorp Configuration Language)でインフラをコードとして記述し、AWS・GCP・Azureなどのクラウドリソ
IT用語: カオスエンジニアリングとは|意図的に障害を起こして耐障害性を高める
本番環境に意図的な障害を注入しシステムの弱点を発見するカオスエンジニアリングの概念とChaos Monkeyを解説。
Docker Compose
複数のDockerコンテナを一括定義・実行するツール。docker-compose.ymlに各サービスの設定を記述し、docker compose upコマンドで全コンテナを起動できる。ローカル開発環境の構築に特に有用。
Helm
KubernetesのパッケージマネージャーAptやyumのK8s版。Helmチャートと呼ばれるテンプレートで複雑なK8sリソースを一括管理・デプロイできる。バージョン管理やロールバックも容易。