Professional Machine Learning Engineer

Question 271

ソーシャルメディアアプリケーション用に、ユーザーが提出したプロフィール写真が要件を満たしているかどうかを予測するMLモデルを構築する必要があります。アプリケーションは、写真が要件を満たしている場合にユーザーに通知します。アプリケーションが準拠していない写真を誤って受け入れないようにするには、どのようにモデルを構築すべきですか?

A.
AutoMLを使用してモデルのリコール(再現率)を最適化し、偽陰性を最小限に抑えます。
B.
AutoMLを使用してモデルのF1スコアを最適化し、偽陽性と偽陰性のバランスを取ります。
C.
Vertex AI Workbenchのユーザー管理ノートブックを使用して、プロフィール写真の要件を満たす写真の例を3倍多く含むカスタムモデルを構築します。
D.
Vertex AI Workbenchのユーザー管理ノートブックを使用して、プロフィール写真の要件を満たさない写真の例を3倍多く含むカスタムモデルを構築します。
Question 272

現在BigQueryに保存されている複数の構造化データセットに対して、分類ワークフローを構築する必要があります。分類を複数回実行するため、探索的データ分析、特徴量選択、モデル構築、トレーニング、ハイパーパラメータ調整、およびサービングといった一連のステップを、コードを書かずに完了させたいと考えています。どうすべきでしょうか?

A.
AutoML Tablesを設定して、分類タスクを実行する。
B.
BigQuery MLタスクを実行して、分類のためのロジスティック回帰を実行する。
C.
AI Platform Notebooksを使用して、pandasライブラリで分類モデルを実行する。
D.
AI Platformを使用して、ハイパーパラメータ調整用に設定された分類モデルジョブを実行する。
Question 273

あなたは大規模な国際企業でデータサイエンスチームを率いています。あなたのチームがトレーニングするモデルのほとんどは、AI Platform上でGPUを使用し、高レベルTensorFlow APIを用いた大規模モデルです。チームがモデルの新しいバージョンをイテレーションするには、通常数週間から数ヶ月かかります。あなたは最近、チームの支出を見直すよう依頼されました。モデルのパフォーマンスに影響を与えることなく、Google Cloudのコンピューティングコストを削減するにはどうすればよいですか?

A.
AI Platformを使用して、チェックポイント付きの分散トレーニングジョブを実行する。
B.
AI Platformを使用して、チェックポイントなしの分散トレーニングジョブを実行する。
C.
Google Kubernetes Engine上のKubeflowでのトレーニングに移行し、チェックポイント付きのプリエンプティブルVMを使用する。
D.
Google Kubernetes Engine上のKubeflowでのトレーニングに移行し、チェックポイントなしのプリエンプティブルVMを使用する。
Question 274

BigQueryに保存されている50,000レコードを含むデータセットに基づいて回帰モデルをトレーニングする必要があります。データには、合計20のカテゴリ特徴量と数値特徴量が含まれており、目的変数は負の値を含む可能性があります。モデルのパフォーマンスを最大化しながら、労力とトレーニング時間を最小限に抑える必要があります。この回帰モデルをトレーニングするには、どのアプローチを取るべきですか?

A.
カスタムTensorFlow DNNモデルを作成する
B.
BQML XGBoost回帰を使用してモデルをトレーニングする。
C.
AutoML Tablesを使用して、早期停止なしでモデルをトレーニングする。
D.
AutoML Tablesを使用して、RMSLEを最適化目標としてモデルをトレーニングする。
Question 275

あなたは、100を超える入力特徴量を持つ線形モデルを構築しています。すべての特徴量の値は-1から1の間です。多くの特徴量が情報を持たないのではないかと疑っています。情報を持つ特徴量は元の形式で保持しつつ、情報を持たない特徴量をモデルから削除したいと考えています。どの手法を使用すべきですか?

A.
主成分分析(PCA)を使用して、最も情報量の少ない特徴量を削除する。
B.
L1正則化を使用して、情報を持たない特徴量の係数を0にする。
C.
モデルを構築した後、Shapley値を使用して、どの特徴量が最も情報を持つかを判断する。
D.
反復的なドロップアウト手法を使用して、削除してもモデルの性能を低下させない特徴量を特定する。