CertPass

Question 231

あなたはAI PlatformでMLモデルを開発し、それを本番環境に移行しようとしています。毎秒数千クエリを処理しており、レイテンシの問題が発生しています。受信リクエストは、Google Kubernetes Engine (GKE) 上で実行されている複数のKubeflow CPUのみのポッドに、ロードバランサーによって分散されています。あなたの目標は、基盤となるインフラストラクチャを変更することなく、サービングのレイテンシを改善することです。何をすべきですか？

TensorFlow Servingの`max_batch_size`パラメータを大幅に増やします。

TensorFlow Servingの`tensorflow-model-server-universal`バージョンに切り替えます。

TensorFlow Servingの`max_enqueued_batches`パラメータを大幅に増やします。

CPU固有の最適化をサポートするためにソースからTensorFlow Servingを再コンパイルします。GKEに対し、サービングノード用に適切なベースライン最小CPUプラットフォームを選択するよう指示します。

Question 232

あなたは、モデルのトレーニングと予測の前に生データを前処理するためにDataflowを使用する需要予測パイプラインを本番環境で運用しています。前処理中に、BigQueryに保存されているデータに対してZスコア正規化を行い、その結果をBigQueryに書き戻しています。新しいトレーニングデータは毎週追加されます。計算時間と手動介入を最小限に抑えることで、このプロセスをより効率的にしたいと考えています。どうすべきですか？

Google Kubernetes Engineを使用してデータを正規化する。

正規化アルゴリズムをSQLに変換し、BigQueryで使用する。

TensorFlowのFeature Column APIのnormalizer_fn引数を使用する。

BigQuery用のDataprocコネクタを使用して、Apache Sparkでデータを正規化する。

Question 233

顧客の購入履歴に基づいて顧客の購入を予測する、Kerasでカスタマイズされたディープニューラルネットワークを設計する必要があります。複数のモデルアーキテクチャを使用してモデルのパフォーマンスを調査し、トレーニングデータを保存し、同じダッシュボードで評価メトリクスを比較できるようにしたいと考えています。何をすべきですか？

AutoML Tablesを使用して複数のモデルを作成する。

Cloud Composerを使用して複数のトレーニング実行を自動化する。

類似したジョブ名でAI Platform上で複数のトレーニングジョブを実行する。

Kubeflow Pipelinesで実験を作成し、複数の実行を整理する。

Question 234

あなたは Google Kubernetes Engine 上で Kubeflow パイプラインを開発しています。パイプラインの最初のステップは、BigQuery に対してクエリを発行することです。そのクエリの結果を、パイプラインの次のステップの入力として使用する予定です。これを可能な限り最も簡単な方法で達成したいと考えています。どうすべきでしょうか？

BigQuery コンソールを使用してクエリを実行し、クエリ結果を新しい BigQuery テーブルに保存します。

BigQuery API を使用して BigQuery に対してクエリを実行する Python スクリプトを作成します。このスクリプトを Kubeflow パイプラインの最初のステップとして実行します。

Kubeflow Pipelines ドメイン固有言語を使用して、Python BigQuery クライアントライブラリを使用してクエリを実行するカスタムコンポーネントを作成します。

GitHub 上の Kubeflow Pipelines リポジトリを探します。BigQuery クエリコンポーネントを見つけ、そのコンポーネントの URL をコピーし、それを使用してコンポーネントをパイプラインにロードします。そのコンポーネントを使用して BigQuery に対してクエリを実行します。

Question 235

あなたは日々の気温を予測するモデルを構築しています。データをランダムに分割し、その後、訓練データセットとテストデータセットを変換しました。モデル訓練用の気温データは1時間ごとにアップロードされます。テスト時、モデルは97%の精度を示しましたが、本番環境にデプロイした後、モデルの精度は66%に低下しました。本番モデルの精度をより高めるにはどうすればよいですか？

訓練データセットとテストデータセットのデータを、2つの別々のステップとして正規化する。

リーケージを避けるために、ランダム分割ではなく時間に基づいて訓練データとテストデータを分割する。

テストのための公正な分布とサンプルを確保するために、テストセットにデータを追加する。

分割前にデータ変換を適用し、変換が訓練セットとテストセットの両方に適用されることを確認するために交差検証を行う。

Professional Machine Learning Engineer