Chaos Engineering
本番システムに意図的に障害を注入し、システムの回復力(レジリエンシー)を検証する実践手法。Netflixが提唱しChaos Monkeyで有名。「障害は必ず起きる」という前提のもと、弱点を事前に発見する。
Chaos Engineeringとは?
本番システムに意図的に障害を注入し、システムの回復力(レジリエンシー)を検証する実践手法。Netflixが提唱しChaos Monkeyで有名。「障害は必ず起きる」という前提のもと、弱点を事前に発見する。
Chaos Engineeringが重要な理由
DevOpsエンジニアにとって Chaos Engineering は現代のインフラ・開発運用において核心的な技術です。クラウドネイティブな環境では、この概念と実装スキルを持つことが標準的に求められるようになっています。
主要なポイント
- 自動化: Chaos Engineeringを活用することで、繰り返し作業をコード化・自動化できます
- スケーラビリティ: 大規模システムの運用・管理が効率化されます
- 信頼性: 人的ミスを減らし、一貫した品質を保つことができます
実務での活用場面
Chaos Engineeringは以下のような場面で使われます:
- CI/CDパイプラインの構築・改善
- インフラのコード化(IaC)
- コンテナ環境・クラウドサービスの管理
まとめ
Chaos Engineering は現代のDevOps・SRE業務に不可欠な技術です。各種ITツールも活用しながら、実践的なスキルを積み上げていきましょう。
関連用語
- SRE
- レジリエンシー
- 可用性
- 障害
関連する用語 (DevOps)
全41件を見るELK Stack
Elasticsearch・Logstash・Kibanaの3ツールの組み合わせ。ログの収集(Logstash)・保存・検索(Elasticsearch)・可視化(Kibana)をセットで提供する定番ログ分析基盤。
CircleCI
クラウド型CI/CDプラットフォーム。.circleci/config.ymlにワークフローを定義し、GitHubやBitbucketと連携してパイプラインを実行。並列実行やキャッシュ機能で高速なCIを提供。
Ansible
構成管理・プロビジョニング自動化ツール。YAMLで記述したPlaybookをエージェントレスで実行し、サーバーの設定を一元管理できる。インフラの自動化とべき等性の確保が特徴。
SAST
Static Application Security Testing(静的アプリケーションセキュリティテスト)の略。ソースコードを実行せずに静的解析して脆弱性を検出する手法。SonarQube・Checkmarx等が代表的ツール。
EKS
Amazon Elastic Kubernetes Serviceの略。AWSが提供するマネージドKubernetesサービス。コントロールプレーンの管理がAWSに委ねられ、WorkerノードにEC2やFargateを使用できる。
kubectl
Kubernetesクラスタを操作するCLIツール。kubectl get pods・apply・delete等のコマンドでK8sリソースを管理する。クラスター管理者の日常ツールとして欠かせない。