お知らせ 運用上のすべての障害から学ぶ システムの運用中に起こるすべての出来事や問題(障害)から学びます。学んだことを基に、システムや手順をより良くするための改善を進めます。これらの学びをチームの中だけでなく、会社全体で共有して、皆がその教訓を活かせるようにします。 2025.09.17 お知らせ
お知らせ 障害を予想する システムに問題(障害)が発生した場合に備えて、その問題の原因を見つけて解決するための練習を行います。具体的には、問題が起こる可能性のあるシナリオ(状況)を考えて、そのシナリオを使ってテストを行い、どんな影響が出るかを確認します。また、問題に... 2025.09.17 お知らせ
お知らせ 運用手順を定期的に改善する 常に最良の運用手順を考えます。運用手順は定期的に見直して改善できるように計画を立て、決まったスケジュールでその手順が効果的に動作しているかを確認します。そして、チームメンバーがその手順を十分に理解していることも確認します。 2025.09.17 お知らせ
お知らせ 小規模かつ可逆的な変更を頻繁に行う システムに変更を加える場合、もし変更が失敗してもすぐに元に戻せるように、まずは小さな部分から変更を始めます。また、できる限りお客様に影響が出ないように工夫します。 2025.09.17 お知らせ
お知らせ 運用をコードとして実行する システムの操作方法をプログラム(コード)として書いておくことで、そのコードがきっかけ(トリガー)となり、自動的に必要な操作が実行されます。これにより、人的ミスが減り、システムの運用が効率的になります。 2025.09.17 お知らせ