Professional Machine Learning Engineer

Question 186

あなたはストリーミング音楽サービスを運営する組織で働いています。ユーザーの最近の聴取履歴に基づいて「次の曲」を推薦する本番環境のカスタムモデルがあります。あなたのモデルはVertex AIエンドポイントにデプロイされています。最近、新しいデータを使用して同じモデルを再トレーニングしました。そのモデルはオフラインで良好なテスト結果を得ました。現在、複雑さを最小限に抑えながら、新しいモデルを本番環境でテストしたいと考えています。どうすべきですか?

A.
新しいモデル用に新しいVertex AIエンドポイントを作成し、新しいモデルをその新しいエンドポイントにデプロイします。本番トラフィックの5%を新しいエンドポイントにランダムに送信するサービスを構築します。聴取時間などのエンドユーザーメトリクスを監視します。時間の経過とともにモデル間でエンドユーザーメトリクスが改善された場合、新しいエンドポイントに送信される本番トラフィックの割合を徐々に増やします。
B.
受信した予測リクエストをBigQueryにキャプチャします。Vertex AI Experimentsで実験を作成します。キャプチャしたデータを使用して両方のモデルのバッチ予測を実行します。ユーザーが選択した曲を使用して、モデルのパフォーマンスを並べて比較します。新しいモデルのパフォーマンスメトリクスが以前のモデルよりも優れている場合は、新しいモデルを本番環境にデプロイします。
C.
新しいモデルを既存のVertex AIエンドポイントにデプロイします。トラフィックスプリッティングを使用して、本番トラフィックの5%を新しいモデルに送信します。聴取時間などのエンドユーザーメトリクスを監視します。時間の経過とともにモデル間でエンドユーザーメトリクスが改善された場合、新しいモデルに送信される本番トラフィックの割合を徐々に増やします。
D.
既存のVertex AIエンドポイントに対してモデル監視ジョブを設定します。予測ドリフトを検出するように監視ジョブを設定し、アラートのしきい値を設定します。エンドポイント上のモデルを以前のモデルから新しいモデルに更新します。予測ドリフトのアラートを受信した場合は、以前のモデルに戻します。
Question 187

あなたはBigQuery MLを使用して線形回帰を実行するモデルを作成しました。毎週収集される累積データでモデルを再トレーニングする必要があります。開発工数とスケジューリングコストを最小限に抑えたいと考えています。どうすべきでしょうか?

A.
BigQueryのスケジューリングサービスを使用して、モデル再トレーニングクエリを定期的に実行する。
B.
Vertex AI Pipelinesで再トレーニングクエリを実行するパイプラインを作成し、Cloud Scheduler APIを使用してクエリを毎週実行する。
C.
Cloud Schedulerを使用して、モデル再トレーニング用のクエリを実行するCloud Functionsを毎週トリガーする。
D.
BigQuery APIコネクタとCloud Schedulerを使用して、モデルを再トレーニングするWorkflowsを毎週トリガーする。
Question 188

scikit-learnの分類器モデルをTensorFlowに移行したいと考えています。scikit-learnモデルの訓練に使用したのと同じ訓練セットを使用してTensorFlow分類器モデルを訓練し、共通のテストセットを使用してパフォーマンスを比較する予定です。Vertex AI Python SDKを使用して各モデルの評価メトリクスを手動でログに記録し、F1スコアと混同行列に基づいて比較したいと考えています。メトリクスはどのようにログに記録すべきですか?

A.
`aiplatform.log_classification_metrics` 関数を使用してF1スコアをログに記録し、`aiplatform.log_metrics` 関数を使用して混同行列をログに記録します。
B.
`aiplatform.log_classification_metrics` 関数を使用してF1スコアと混同行列をログに記録します。
C.
`aiplatform.log_metrics` 関数を使用してF1スコアと混同行列をログに記録します。
D.
`aiplatform.log_metrics` 関数を使用してF1スコアをログに記録し、`aiplatform.log_classification_metrics` 関数を使用して混同行列をログに記録します。
Question 189

あなたは、あなたの会社がよりターゲットを絞ったオンライン広告キャンペーンを作成するのを支援するためのモデルを開発しています。そのモデルを訓練するために使用するデータセットを作成する必要があります。モデルにおける不公平なバイアスを作成したり強化したりすることを避けたいと考えています。何をすべきですか?(2つ選択してください。)

A.
包括的な人口統計学的特徴のセットを含める
B.
広告と最も頻繁にやり取りする人口統計学的グループのみを含める
C.
訓練データセットを構築するために、本番トラフィックのランダムサンプルを収集する
D.
訓練データセットを構築するために、本番トラフィックの層化サンプルを収集する
E.
訓練済みモデルに対して、機密性の高いカテゴリや人口統計にわたる公平性テストを実施する
Question 190

あなたは規制対象の保険会社に勤務するMLエンジニアです。見込み顧客からの保険申請を承認または却下する保険承認モデルを開発するよう依頼されました。モデルを構築する前に、どのような要素を考慮すべきですか?

A.
リダクション、再現性、説明可能性
B.
トレーサビリティ、再現性、説明可能性
C.
連合学習、再現性、説明可能性
D.
差分プライバシー、連合学習、説明可能性