Professional Machine Learning Engineer

Question 141

あなたは電気通信会社に勤務しています。次の電話料金の支払いを怠る可能性のある顧客を予測するモデルを構築しています。このモデルの目的は、リスクのある顧客に対し、サービス割引や請求期限の延長といった支援を積極的に提供することです。データはBigQueryに保存されており、モデルの訓練に利用可能な予測特徴量には以下が含まれます。 - 顧客ID (Customer_id) - 年齢 (Age) - 給与 (Salary)(現地通貨単位) - 性別 (Sex) - 平均請求額 (Average bill value)(現地通貨単位) - 先月の通話回数 (Number of phone calls in the last month)(整数) - 平均通話時間 (Average duration of phone calls)(分単位) あなたは、不利な立場にあるグループに対する潜在的なバイアスを調査・軽減しつつ、モデルの精度を維持する必要があります。 どうすべきですか?

A.
センシティブな特徴量と他の特徴量との間に意味のある相関関係があるかどうかを判断します。BigQuery MLのブーステッドツリー分類モデルを訓練し、センシティブな特徴量と意味のある相関関係のある特徴量を除外します。
B.
全ての特徴量を使用してBigQuery MLのブーステッドツリー分類モデルを訓練します。ML.GLOBAL_EXPLAINメソッドを使用して、モデルの各特徴量のグローバルな寄与度を計算します。センシティブな特徴量のいずれかの特徴量重要度がしきい値を超えた場合、モデルを破棄し、この特徴量なしで訓練します。
C.
全ての特徴量を使用してBigQuery MLのブーステッドツリー分類モデルを訓練します。ML.EXPLAIN_PREDICTメソッドを使用して、テストセットの各顧客について各特徴量の寄与度を計算します。個々の顧客について、いずれかの特徴量の重要度が事前に定義されたしきい値を超えた場合、モデルを破棄し、この特徴量なしでモデルを再訓練します。
D.
センシティブな特徴量全体での精度によって表される公平性メトリックを定義します。全ての特徴量を使用してBigQuery MLのブーステッドツリー分類モデルを訓練します。訓練済みモデルを使用してテストセットで予測を行います。データをセンシティブな特徴量と結合し直し、公平性メトリックを計算して要件を満たしているかどうかを調査します。
Question 142

最近トレーニングしたXGBoostモデルを、オンライン推論のために本番環境にデプロイする予定です。モデルのバイナリに予測リクエストを送信する前に、簡単なデータ前処理ステップを実行する必要があります。このステップは、内部VPC Service Controls内でリクエストを受け付け、予測を返すREST APIを公開します。この前処理ステップを、コストと労力を最小限に抑えて構成したいと考えています。どうすべきでしょうか?

A.
pickle化されたモデルをCloud Storageに保存します。Flaskベースのアプリを構築し、そのアプリをカスタムコンテナイメージにパッケージ化し、Vertex AI エンドポイントにモデルをデプロイします。
B.
Flaskベースのアプリを構築し、そのアプリとpickle化されたモデルをカスタムコンテナイメージにパッケージ化し、Vertex AI エンドポイントにモデルをデプロイします。
C.
Vertex AI SDKのXGBoost Predictorをベースにしたカスタム予測子クラスを構築し、それとpickle化されたモデルをVertex AIの事前ビルド済みコンテナイメージをベースにしたカスタムコンテナイメージにパッケージ化し、Vertex AI エンドポイントにモデルをデプロイします。
D.
Vertex AI SDKのXGBoost Predictorをベースにしたカスタム予測子クラスを構築し、そのハンドラをVertex AIの事前ビルド済みコンテナイメージをベースにしたカスタムコンテナイメージにパッケージ化します。pickle化されたモデルをCloud Storageに保存し、Vertex AI エンドポイントにモデルをデプロイします。
Question 143

あなたは銀行に勤務しています。ローンの申請決定を支援するための信用リスクモデルを開発する必要があります。TensorFlowのニューラルネットワークを使用してモデルを実装することにしました。規制要件のため、モデルの予測をその特徴量に基づいて説明できる必要があります。モデルがデプロイされた際には、モデルのパフォーマンスを時系列で監視したいと考えています。モデルの開発とデプロイの両方にVertex AIを使用することにしました。何をすべきでしょうか?

A.
Vertex Explainable AIをサンプリングされたShapley法で使用し、Vertex AIモデルモニタリングを有効にして特徴量の分布ドリフトを確認する。
B.
Vertex Explainable AIをサンプリングされたShapley法で使用し、Vertex AIモデルモニタリングを有効にして特徴量の分布スキューを確認する。
C.
Vertex Explainable AIをXRAI法で使用し、Vertex AIモデルモニタリングを有効にして特徴量の分布ドリフトを確認する。
D.
Vertex Explainable AIをXRAI法で使用し、Vertex AIモデルモニタリングを有効にして特徴量の分布スキューを確認する。
Question 144

あなたは、モデルの1つが犯した誤分類エラーの根本原因を調査しています。モデルのトレーニングとデプロイには Vertex AI Pipelines を使用しました。このパイプラインは BigQuery からデータを読み込み、Cloud Storage に TFRecord 形式でデータのコピーを作成し、そのコピーを使用して Vertex AI Training でモデルをトレーニングし、Vertex AI エンドポイントにモデルをデプロイします。誤分類を行ったモデルの特定のバージョンを特定し、このモデルがトレーニングされたデータを復元する必要があります。そのデータのコピーをどのように見つけるべきですか?

A.
Vertex AI Feature Store を使用します。パイプラインを変更してフィーチャストアを使用するようにし、すべてのトレーニングデータがそこに保存されるようにします。トレーニングに使用されたデータをフィーチャストアで検索します。
B.
Vertex AI Metadata のリネージ機能を使用してモデルアーティファクトを見つけます。モデルのバージョンを特定し、データコピーを作成するステップを特定し、メタデータでその場所を検索します。
C.
Vertex AI エンドポイントのロギング機能を使用して、モデルのデプロイのタイムスタンプを特定します。そのタイムスタンプのパイプライン実行を見つけます。データコピーを作成するステップを特定し、ログでその場所を検索します。
D.
モデルのトレーニングに対応するジョブ ID を Vertex AI Training で見つけます。そのジョブのログでトレーニングに使用されたデータを検索します。
Question 145

あなたは製造会社に勤務しています。組立ラインの最終工程で製品の欠陥を検出するために、カスタム画像分類モデルをトレーニングする必要があります。モデルのパフォーマンスは良好ですが、ホールドアウトセット内の一部の画像が一貫して高い信頼度で誤分類されています。Vertex AIを使用してモデルの結果を理解したいと考えています。どうすべきでしょうか?

A.
統合勾配(Integrated Gradients)を使用して特徴ベースの説明を設定します。可視化タイプを「PIXELS」に設定し、clip_percent_upperboundを95に設定します。
B.
Vertex AI Matching Engineを使用してインデックスを作成します。誤分類された画像でインデックスにクエリを実行します。
C.
XRAIを使用して特徴ベースの説明を設定します。可視化タイプを「OUTLINES」に設定し、極性(polarity)を「positive」に設定します。
D.
例ベースの説明を設定します。潜在空間表現に使用する埋め込み出力層を指定します。