Professional Cloud DevOps Engineer
あなたは、ウェブアプリケーションの新機能がユーザーに好まれるかどうかを確認するための実験を行っています。カナリアリリースとしてその機能をデプロイした直後、ユーザーに送信される500エラーの数が急増し、モニタリングレポートではレイテンシの増加が示されました。ユーザーへの悪影響を迅速に最小限に抑えたいと考えています。最初に何をすべきですか?
あなたは、インフラストラクチャを定義するTerraformテンプレートの作成と変更を担当しています。2人の新しいエンジニアも同じコードで作業するため、お互いのコードを上書きすることを防ぐプロセスを定義し、ツールを導入する必要があります。また、最新バージョンですべての更新がキャプチャされるようにしたいと考えています。何をすべきでしょうか?
あなたは、マイクロサービスアーキテクチャを採用した高トラフィックのウェブアプリケーションをサポートしています。アプリケーションのホームページには、現在の天気、株価、ニュースの見出しなどのコンテンツを含む複数のウィジェットが表示されます。メインのサービングスレッドは、ウィジェットごとに専用のマイクロサービスを呼び出し、ユーザーのためにホームページをレイアウトします。マイクロサービスは時折失敗することがあり、その場合、サービングスレッドは一部のコンテンツが欠けた状態でホームページを提供します。アプリケーションのユーザーは、この劣化モードが頻繁に発生すると不満を感じますが、全くコンテンツが提供されないよりは、一部でもコンテンツが提供されることを望んでいます。ユーザーエクスペリエンスが過度に低下しないように、サービスレベル目標(SLO)を設定したいと考えています。これを測定するために使用すべきサービスレベル指標(SLI)は何ですか?
あなたの組織は、サイト信頼性エンジニアリング(SRE)の文化と原則を導入しようとしています。最近、あなたがサポートしているサービスで限定的な障害が発生しました。別のチームのマネージャーから、是正措置を講じられるように、何が起こったのか正式な説明を提供するよう求められました。あなたは何をすべきですか?
あなたは、グローバル HTTP/S クラウドロードバランサ (CLB) の背後にある Google Kubernetes Engine (GKE) 上で実行されているマルチリージョンウェブサービスをサポートしています。従来の理由により、ユーザーリクエストはまずサードパーティのコンテンツ配信ネットワーク (CDN) を経由し、その後トラフィックが CLB にルーティングされます。あなたは既に CLB レベルで可用性サービスレベル指標 (SLI) を実装しています。しかし、潜在的なロードバランサの設定ミス、CDN 障害、またはその他のグローバルネットワークの大規模障害が発生した場合に備えて、カバレッジを向上させたいと考えています。この新しい SLI はどこで測定すべきですか? (2つ選択してください。)