Professional Machine Learning Engineer

Question 76

あなたは顧客の取引を含むデータセットを扱っています。顧客の購買行動を予測するMLモデルを構築する必要があります。BigQuery MLでモデルを開発し、オンライン予測のためにCloud Storageにエクスポートする予定です。入力データには、製品カテゴリや支払い方法など、いくつかのカテゴリ特徴量が含まれていることに気づきました。モデルをできるだけ早くデプロイしたいと考えています。どうすべきでしょうか?

A.
モデル作成時にTRANSFORM句とML.ONE_HOT_ENCODER関数をカテゴリ特徴量に使用し、カテゴリ特徴量と非カテゴリ特徴量を選択する。
B.
カテゴリ特徴量にML.ONE_HOT_ENCODER関数を使用し、エンコードされたカテゴリ特徴量と非カテゴリ特徴量を入力として選択してモデルを作成する。
C.
CREATE MODELステートメントを使用し、カテゴリ特徴量と非カテゴリ特徴量を選択する。
D.
カテゴリ特徴量にML.MULTI_HOT_ENCODER関数を使用し、エンコードされたカテゴリ特徴量と非カテゴリ特徴量を入力として選択してモデルを作成する。
Question 77

Cloud Storage バケットに格納されたラベル付き画像を含む大規模なデータセットを使用して、画像分類モデルを開発する必要があります。どうすればよいですか?

A.
Vertex AI パイプラインと Kubeflow Pipelines SDK を使用して、Cloud Storage から画像を読み取り、モデルをトレーニングするパイプラインを作成する。
B.
Vertex AI パイプラインと TensorFlow Extended (TFX) を使用して、Cloud Storage から画像を読み取り、モデルをトレーニングするパイプラインを作成する。
C.
Vertex AI でラベル付き画像をマネージドデータセットとしてインポートし、AutoML を使用してモデルをトレーニングする。
D.
Dataflow を使用して画像データセットを表形式に変換し、データを BigQuery にロードして、BigQuery ML を使用してモデルをトレーニングする。
Question 78

あなたはクレジットカードの不正取引を検出するモデルを開発しています。1件でも不正取引を見逃すとクレジットカード保有者に深刻な影響を与える可能性があるため、検出を優先する必要があります。あなたはAutoMLを使用して、ユーザーのプロファイル情報とクレジットカード取引データでモデルをトレーニングしました。初期モデルのトレーニング後、モデルが多くの不正取引を検出できていないことに気づきました。モデルのパフォーマンスを向上させるために、AutoMLのトレーニングパラメータをどのように調整すべきですか?(2つ選択してください。)

A.
スコアのしきい値を上げる
B.
スコアのしきい値を下げる
C.
トレーニングセットに陽性例(不正取引の例)を追加する
D.
トレーニングセットに陰性例(正常取引の例)を追加する
E.
トレーニングの最大ノード時間を減らす
Question 79

あなたは、個人を特定できる情報 (PII) を含む可能性のあるファイルを Google Cloud にストリーミングするリアルタイム予測エンジンを構築しています。Cloud Data Loss Prevention (DLP) API を使用してファイルをスキャンしたいと考えています。PII が権限のない個人によってアクセスされないようにするには、どのようにすべきですか?

A.
すべてのファイルを Google Cloud にストリーミングし、その後データを BigQuery に書き込みます。DLP API を使用して定期的にテーブルの一括スキャンを実施します。
B.
すべてのファイルを Google Cloud にストリーミングし、データのバッチを BigQuery に書き込みます。データが BigQuery に書き込まれている間に、DLP API を使用してデータの一括スキャンを実施します。
C.
機密データ用と非機密データ用の2つのバケットを作成します。すべてのデータを非機密バケットに書き込みます。DLP API を使用してそのバケットの定期的な一括スキャンを実施し、機密データを機密バケットに移動します。
D.
隔離用、機密用、非機密用の3つのデータバケットを作成します。すべてのデータを隔離バケットに書き込みます。DLP API を使用してそのバケットの定期的な一括スキャンを実施し、データを機密バケットまたは非機密バケットのいずれかに移動します。
Question 80

scikit-learnの分類モデルを本番環境にデプロイする必要があります。このモデルは24時間365日リクエストを処理できなければならず、午前8時から午後7時までの間、本番アプリケーションには毎秒数百万のリクエストが予想されます。デプロイコストは最小限に抑える必要があります。どうすればよいですか?

A.
オンラインのVertex AI予測エンドポイントをデプロイします。最大レプリカ数を1に設定します。
B.
オンラインのVertex AI予測エンドポイントをデプロイします。最大レプリカ数を100に設定します。
C.
レプリカごとに1つのGPUを持つオンラインのVertex AI予測エンドポイントをデプロイします。最大レプリカ数を1に設定します。
D.
レプリカごとに1つのGPUを持つオンラインのVertex AI予測エンドポイントをデプロイします。最大レプリカ数を100に設定します。