Professional Machine Learning Engineer

Question 291

あなたは、自社のマーケティング活動に基づいた売上予測データセットを与えられました。データは構造化され、BigQueryに保存されており、データアナリストのチームによって慎重に管理されています。あなたはこのデータの予測能力に関する洞察を提供するレポートを作成する必要があります。単純なモデルや多層ニューラルネットワークを含む、さまざまな洗練度の機械学習(ML)モデルをいくつか実行するよう依頼されました。実験結果を収集するために与えられた時間は数時間しかありません。このタスクを最も効率的かつセルフサービスな方法で完了するには、どのGoogle Cloudツールを使用すべきですか?

A.
BigQuery MLを使用して複数の回帰モデルを実行し、そのパフォーマンスを分析する。
B.
Dataprocを使用してBigQueryからデータを読み取り、SparkMLを使用して複数のモデルを実行する。
C.
Vertex AI Workbenchのユーザー管理ノートブックとscikit-learnコードを使用して、さまざまなMLアルゴリズムとパフォーマンス指標を扱う。
D.
Vertex AIでカスタムTensorFlowモデルをトレーニングし、BigQueryからデータを読み取り、さまざまなMLアルゴリズムを特徴とする。
Question 292

あなたは銀行のMLエンジニアです。顧客がローンの支払いを期日通りに行うかどうかを予測するために、AutoML Tablesを使用して二値分類モデルを開発しました。このモデルの出力は、ローンの申請を承認または却下するために使用されます。ある顧客のローン申請があなたのモデルによって却下され、銀行のリスク部門から、モデルの決定に寄与した理由を提供するよう求められています。あなたは何をすべきですか?

A.
予測から得られるローカル特徴量の重要度を使用する。
B.
データサマリーページのターゲット値との相関関係を使用する。
C.
モデル評価ページの特徴量の重要度のパーセンテージを使用する。
D.
分類を変更する各特徴量のしきい値を特定するために、特徴量を個別に変化させる。
Question 293

あなたは雑誌の販売代理店に勤務しており、来年度の購読を更新する顧客を予測するモデルを構築する必要があります。会社の過去のデータをトレーニングセットとして使用し、TensorFlowモデルを作成してAI Platformにデプロイしました。モデルによって提供される各予測について、どの顧客属性が最も予測力を持つかを判断する必要があります。どうすればよいですか?

A.
AI Platform Notebooksを使用してモデルに対してLasso回帰分析を実行します。これにより、強いシグナルを提供しない特徴量が除外されます。
B.
予測結果をBigQueryにストリーミングします。BigQueryのCORR(X1, X2)関数を使用して、各特徴量とターゲット変数間のピアソン相関係数を計算します。
C.
AI PlatformのAI Explanations機能を使用します。「explain」キーワードを付けて各予測リクエストを送信し、サンプリングされたShapley法を使用して特徴量アトリビューションを取得します。
D.
Google CloudのWhat-Ifツールを使用して、個々の特徴量が除外された場合にモデルがどのように動作するかを判断します。モデルから除外されたときに最も大幅なパフォーマンス低下を引き起こした順に、特徴量の重要度をランク付けします。
Question 294

あなたはAI Platformを使用して、CTスキャンの画像セグメンテーションのためのMLモデルを開発しています。最新の研究論文に基づいてモデルアーキテクチャを頻繁に更新し、同じデータセットでトレーニングを再実行してパフォーマンスをベンチマークする必要があります。コードのバージョン管理を行いながら、計算コストと手動介入を最小限に抑えたいと考えています。どうすべきでしょうか?

A.
Cloud Functionsを使用してCloud Storage内のコードの変更を識別し、再トレーニングジョブをトリガーする。
B.
コードを更新する際に、gcloudコマンドラインツールを使用してAI Platformでトレーニングジョブを送信する。
C.
Cloud Source Repositoriesと連携したCloud Buildを使用して、新しいコードがリポジトリにプッシュされたときに再トレーニングをトリガーする。
D.
Cloud Composerで自動化されたワークフローを作成し、毎日実行してセンサーを使用してCloud Storage内のコードの変更を探す。
Question 295

あなたは、スキャンされた機密文書の画像に会社のロゴが含まれているかどうかを検出する二値分類機械学習アルゴリズムに取り組んでいます。データセットでは、サンプルの96%にロゴが含まれていないため、データセットは非常に不均衡です。どの評価指標が、あなたのモデルに対して最も信頼性を与えるでしょうか?

A.
再現率が適合率よりも重視されるF値
B.
RMSE(二乗平均平方根誤差)
C.
F1スコア
D.
適合率が再現率よりも重視されるF値