Professional Machine Learning Engineer

Question 166

あなたはモデルをトレーニングし、サービング用にカスタムDockerコンテナでパッケージ化し、Vertex AI Model Registryにデプロイしました。バッチ予測ジョブを送信すると、次のエラーで失敗します:"エラー モデルサーバーが準備完了になりませんでした。モデルファイルまたはコンテナ設定が有効であることを確認してください。" ログには追加のエラーはありません。どうすればよいですか?

A.
アプリケーションにロギング設定を追加して、Cloud Loggingにログを出力するようにします。
B.
モデルの設定でHTTPポートをデフォルト値の8080に変更します。
C.
モデルの設定でhealthRouteの値を/healthcheckに変更します。
D.
Dockerイメージをローカルにプルし、docker runコマンドを使用してローカルで起動します。docker logsコマンドを使用してエラーログを調査します。
Question 167

あなたは、画像内の自社製品を識別するためのMLモデルを開発しています。Cloud Storageバケットに100万枚以上の画像があり、これらにアクセスできます。Vertex AI Trainingを使用して、さまざまなTensorFlowモデルで実験を行う予定です。トレーニング中に大規模な画像を読み込み、データI/Oのボトルネックを最小限に抑える必要があります。どうすればよいですか?

A.
Cloud Storage FUSEを使用して、画像をVertex AIコンピューティングノードに直接ロードします。tf.data.Dataset.from_tensor_slices関数を使用して画像を読み込みます。
B.
画像データからVertex AIマネージドデータセットを作成します。AIP_TRAINING_DATA_URI環境変数を介してアクセスし、tf.data.Dataset.list_files関数を使用して画像を読み込みます。
C.
画像をTFRecordに変換し、Cloud Storageバケットに保存します。tf.data.TFRecordDataset関数を使用してTFRecordを読み込みます。
D.
画像のURLをCSVファイルに保存します。tf.data.experimental.CsvDataset関数を使用してファイルを読み込みます。
Question 168

あなたはソーシャルメディア企業に勤務しています。投稿された画像に車が含まれているかどうかを検出する必要があります。各訓練サンプルは正確に1つのクラスに属します。あなたは物体検出ニューラルネットワークを訓練し、評価のためにモデルバージョンをAI Platform Predictionにデプロイしました。デプロイ前に、評価ジョブを作成し、それをAI Platform Predictionのモデルバージョンにアタッチしました。適合率がビジネス要件で許容されるよりも低いことに気づきました。適合率を向上させるために、モデルの最終層のソフトマックス閾値をどのように調整すべきですか?

A.
再現率を上げる。
B.
再現率を下げる。
C.
偽陽性の数を増やす。
D.
偽陰性の数を減らす。
Question 169

あなたはeコマースのスタートアップ企業に勤務しています。顧客離反予測モデルを作成する必要があります。会社の最近の販売記録はBigQueryテーブルに保存されています。あなたは、初期モデルがどのように予測を行っているかを理解したいと考えています。また、コストを最小限に抑えながら、できるだけ迅速にモデルを反復開発したいと考えています。最初のモデルはどのように構築すべきですか?

A.
データをCloud Storageバケットにエクスポートします。Vertex AI Workbench上のpandas DataFrameにデータをロードし、scikit-learnを使用してロジスティック回帰モデルを訓練します。
B.
TensorFlow BigQueryClientを使用してtf.data.Datasetを作成します。TensorFlowでディープニューラルネットワークを実装します。
C.
BigQueryでデータを準備し、Vertex AIデータセットにデータを関連付けます。AutoMLTabularTrainingJobを作成して分類モデルを訓練します。
D.
データをCloud Storageバケットにエクスポートします。Cloud Storageからデータを読み込むためのtf.data.Datasetを作成します。TensorFlowでディープニューラルネットワークを実装します。
Question 170

あなたは、表形式データに基づく新しいXGBoost分類モデルのトレーニングパイプラインを開発しています。データはBigQueryテーブルに保存されています。以下のステップを完了する必要があります。 1. データをトレーニングデータセットと評価データセットに65/35の比率でランダムに分割する 2. 特徴量エンジニアリングを実施する 3. 評価データセットのメトリクスを取得する 4. 異なるパイプライン実行でトレーニングされたモデルを比較する これらのステップをどのように実行すべきですか?

A.
1. Vertex AI Pipelinesを使用して、データをトレーニングセットと評価セットに分割するコンポーネントと、特徴量エンジニアリング用の別のコンポーネントを追加します。 2. トレーニングコンポーネントでメトリクスの自動ロギングを有効にします。 3. Vertex AI Experimentsでパイプラインの実行を比較します。
B.
1. Vertex AI Pipelinesを使用して、データをトレーニングセットと評価セットに分割するコンポーネントと、特徴量エンジニアリング用の別のコンポーネントを追加します。 2. トレーニングコンポーネントでメトリクスの自動ロギングを有効にします。 3. Vertex ML Metadataのアーティファクトのリネージを使用してモデルを比較します。
C.
1. BigQuery MLで、モデルタイプとしてBOOSTED_TREE_CLASSIFIERを指定したCREATE MODELステートメントを使用し、BigQueryでデータ分割を処理します。 2. SQLビューを使用して特徴量エンジニアリングを適用し、そのビューのデータを使用してモデルをトレーニングします。 3. ML.TRAINING_INFOステートメントを含むSQLクエリを使用して、モデルの評価メトリクスを比較します。
D.
1. BigQuery MLで、モデルタイプとしてBOOSTED_TREE_CLASSIFIERを指定したCREATE MODELステートメントを使用し、BigQueryでデータ分割を処理します。 2. ML TRANSFORMを使用して特徴量エンジニアリングの変換を指定し、テーブルのデータを使用してモデルをトレーニングします。 3. ML.TRAINING_INFOステートメントを含むSQLクエリを使用して、モデルの評価メトリクスを比較します。