Professional Cloud DevOps Engineer
Google Kubernetes Engine (GKE) クラスタ内のノードで潜在的な悪意のあるアクティビティを示す Cloud Monitoring アラートを受信しました。アラートは、そのノード上で実行されているコンテナが侵害された可能性を示唆しています。問題を調査する間、さらなる侵害を防ぐためにこのノードを隔離する必要があります。また、クラスタ上で実行されているアプリケーションへの影響を最小限に抑えたいと考えています。どうすべきでしょうか?
あなたの会社では、12のマイクロサービスから構成されるアプリケーションをGoogle Kubernetes Engine (GKE) にデプロイしています。複数のチームが、Dev(開発)、Staging(ステージング)、Prod(本番)の3つの環境で、様々な機能について同時に作業しています。開発者からは、共有のDev GKEクラスタにおける複数の機能ブランチからのデプロイが原因で、依存関係テストの失敗やリリースの遅延が報告されています。 あなたは、開発者が他の開発活動から隔離された安定した開発環境でマイクロサービスの機能をテストできるようにするための、費用対効果の高いソリューションを実装する必要があります。どうすべきでしょうか?
あなたはCI/CDパイプラインで失敗したデプロイのトラブルシューティングを行っています。デプロイログによると、環境変数の欠落によりアプリケーションコンテナの起動に失敗したことが示されています。根本原因を特定し、この問題の再発を防ぐためにCI/CDワークフロー内に解決策を実装する必要があります。何をすべきですか?
あなたの会社では、本番システムでバグ、障害、パフォーマンス低下が発生しています。開発者は新機能の開発やバグ修正に本番環境を使用しています。設定変更や実験が本番環境で行われ、ユーザーに障害を引き起こしています。テスターは負荷テストに本番環境を使用しており、これがしばしば本番システムのパフォーマンスを低下させています。本番環境でのバグや障害の数を減らし、テスターが新機能の負荷テストを行えるようにするために、環境を再設計する必要があります。何をすべきでしょうか?
あなたは無料の写真処理アプリケーションを提供する会社に勤務しています。あなたは写真を処理するバックエンドサービスのインフラストラクチャを設計しています。このサービスは以下の特徴を持ちます: • 未処理および処理済みの両方の写真を保存するために Cloud Storage を使用します。 • 障害発生時に写真の処理を再開できます。 • コンテナ化には適していません。 写真の処理時間に関する SLO (サービスレベル目標) はありません。あなたはこのサービスを実行するための最もコスト効率の良いソリューションを選択する必要があります。どうすべきですか?