本投稿は TECOTEC Advent Calendar 2025 の14日目の記事です。
SRE推進室の豊田です。今年4月に新卒で入社しました。
普段はインフラエンジニアとしてAWSの保守運用業務を主に行っています。
本記事では未経験でインフラエンジニアになった私がよく直面した運用監視上の異常について、その原因と対応フローをご紹介します。
目次
- 想定するAWSの構成について
- 異常①:ALBのヘルスチェック失敗について
- ヘルスチェックが失敗する原因
- ヘルスチェック失敗時の原因の確認と対応
- 異常②:Auroraのメトリクスが途切れる
- Auroraのメトリクスが途切れた原因
- Auroraのメトリクスが途切れた原因の確認と対応
- まとめ
- テコテックの採用活動について