Professional Machine Learning Engineer

Question 31

Cloud TPU v2を使用して物体検出モデルをトレーニングしています。トレーニング時間が予想よりも長くなっています。Cloud TPUプロファイルから取得したこの簡略化されたトレースに基づいて、コスト効率の良い方法でトレーニング時間を短縮するためにどのようなアクションを実行すべきですか?

Question
A.
Cloud TPU v2からCloud TPU v3に移行し、バッチサイズを増やす。
B.
Cloud TPU v2から8つのNVIDIA V100 GPUに移行し、バッチサイズを増やす。
C.
入力関数を書き換えて、入力画像をリサイズおよび再形成する。
D.
並列読み取り、並列処理、プリフェッチを使用して入力関数を書き換える。
Question 32

データセットの探索的データ分析を行っている際に、ある重要なカテゴリ特徴量に5%の欠損値があることがわかりました。欠損値から生じる可能性のあるバイアスを最小限に抑えたいと考えています。これらの欠損値にどのように対処すべきですか?

A.
欠損値のある行を削除し、データセットを5%アップサンプリングする。
B.
欠損値を特徴量の平均値で置き換える。
C.
欠損値を、欠損値であることを示すプレースホルダーカテゴリで置き換える。
D.
欠損値のある行を検証データセットに移動する。
Question 33

あなたは農業研究チームのMLエンジニアで、作物の画像から葉のさび病の斑点を検出し、病気の存在を判断するための作物病害検出ツールに取り組んでいます。これらの斑点は、形状や大きさが様々であり、病気の重症度と相関しています。あなたは、病気の存在と重症度を高精度で予測するソリューションを開発したいと考えています。どうすべきでしょうか?

A.
さび病の斑点を特定できる物体検出モデルを作成する。
B.
さび病の斑点の境界を特定するための画像セグメンテーションMLモデルを開発する。
C.
従来のコンピュータビジョンライブラリを使用してテンプレートマッチングアルゴリズムを開発する。
D.
病気の存在を予測するための画像分類MLモデルを開発する。
Question 34

あなたは、Kerasを使用して構築された概念実証(PoC)のMLモデルを本番環境に移行するよう依頼されました。このモデルは、データサイエンティストのローカルマシン上のJupyter Notebookでトレーニングされました。Notebookには、データ検証を実行するセルとモデル分析を実行するセルが含まれています。あなたは、Notebookに含まれるステップをオーケストレーションし、毎週の再トレーニングのためにこれらのステップの実行を自動化する必要があります。将来的には、トレーニングデータが大幅に増加すると予想されます。あなたは、コストを最小限に抑えながら、マネージドサービスを活用するソリューションを望んでいます。どうすべきでしょうか?

A.
Jupyter Notebookを最大N2マシンタイプのNotebooksインスタンスに移動し、Cloud Schedulerを使用してNotebooksインスタンス内のステップの実行をスケジュールします。
B.
コードをTensorFlow Extended (TFX) パイプラインとして記述し、Vertex AI Pipelinesでオーケストレーションします。データ検証とモデル分析には標準のTFXコンポーネントを使用し、モデルの再トレーニングにはVertex AI Pipelinesを使用します。
C.
Jupyter NotebookのステップをApache Sparkジョブとして書き換え、Cloud Schedulerを使用して一時的なDataprocクラスタでジョブの実行をスケジュールします。
D.
Jupyter Notebookに含まれるステップをPythonスクリプトとして抽出し、各スクリプトをApache Airflow BashOperatorでラップし、結果として得られる有向非巡回グラフ(DAG)をCloud Composerで実行します。
Question 35

あなたはGoogle Cloud上で深層ニューラルネットワークモデルを訓練しました。このモデルは訓練データでの損失は低いものの、検証データでの性能は劣っています。モデルが過学習に対して頑健になるようにしたいと考えています。モデルを再訓練する際に、どの戦略を使用すべきですか?

A.
0.2のドロップアウトパラメータを適用し、学習率を1/10に下げる。
B.
0.4のL2正則化パラメータを適用し、学習率を1/10に下げる。
C.
AI Platformでハイパーパラメータチューニングジョブを実行し、L2正則化とドロップアウトパラメータを最適化する。
D.
AI Platformでハイパーパラメータチューニングジョブを実行して学習率を最適化し、ニューロン数を2倍に増やす。