Professional Cloud DevOps Engineer
Cloud Run で実行されているアプリケーションがあります。アプリケーションの新しいバージョンをテストするために本番稼働中のトラフィックを使用しつつ、品質保証チームには手動テストを実施させたいと考えています。新しいバージョンのテスト中に問題が発生した場合の潜在的な影響を限定し、必要に応じてアプリケーションの以前のバージョンにロールバックできる必要があります。新しいバージョンはどのようにデプロイすべきですか?(2つ選択してください。)
最近、あなたのサービスの一つが、現在のローリングウィンドウ期間のエラーバジェットを超過したことに気づきました。あなたの会社の製品チームは、新しい機能をローンチしようとしています。サイトリライアビリティエンジニアリング(SRE)のプラクティスに従いたいと考えています。あなたは何をすべきですか?
あなたは組織にポストモーテムを導入する必要があります。ポストモーテムのプロセスがうまく受け入れられるようにしたいと考えています。何をすべきでしょうか?(2つ選択)
あなたは、複数のGoogle Kubernetes Engine (GKE) クラスタにわたって、いくつかの制約テンプレートを適用する必要があります。これらの制約には、Kubernetes APIの制限などのポリシーパラメータが含まれます。ポリシーパラメータがGitHubリポジトリに保存され、変更が発生した際に自動的に適用されるようにしなければなりません。どうすればよいでしょうか?
あなたは、あるサービスで発生中のインシデントに対応するオペレーションリードです。このサービスは通常、約70%のキャパシティで稼働しています。1つのノードがすべてのリクエストに対して5xxエラーを返していることに気づきました。また、顧客からのサポートケースも著しく増加しています。問題のあるノードをロードバランサープールから削除し、そのノードを隔離して調査する必要があります。インシデントを管理し、ユーザーへの影響を軽減するために、Googleが推奨するプラクティスに従いたいと考えています。何をすべきでしょうか?