Professional Machine Learning Engineer

Question 246

あなたは会社のリードMLエンジニアとして、スキャンされた顧客フォームをデジタル化するためのMLモデルの構築を担当しています。スキャンされた画像をテキストに変換し、Cloud Storageに保存するTensorFlowモデルを開発しました。毎日終わりに収集される集計データに対して、最小限の手動介入でこのMLモデルを使用する必要があります。何をすべきでしょうか?

A.
AI Platformのバッチ予測機能を使用する。
B.
予測のためにCompute Engineでサービングパイプラインを作成する。
C.
新しいデータポイントが取り込まれるたびに、予測のためにCloud Functionsを使用する。
D.
モデルをAI Platformにデプロイし、オンライン推論用のバージョンを作成する。
Question 247

あなたは最近、数千のデータセットを持つエンタープライズ規模の会社に入社しました。BigQueryの各テーブルには正確な説明があることを知っており、AI Platformで構築しているモデルに使用する適切なBigQueryテーブルを探しています。必要なデータはどのように見つけるべきですか?

A.
Data Catalogを使用して、テーブルの説明にあるキーワードでBigQueryデータセットを検索する。
B.
AI Platformの各モデルおよびバージョンリソースに、トレーニングに使用されたBigQueryテーブルの名前でタグを付ける。
C.
テーブルの説明をテーブルIDにマッピングするルックアップテーブルをBigQueryで維持する。必要なデータの正しいテーブルIDを見つけるために、ルックアップテーブルをクエリする。
D.
BigQueryにネイティブなINFORMATION_SCHEMAメタデータテーブルを使用して、プロジェクト内の既存のすべてのテーブル名を取得するクエリをBigQueryで実行する。その結果を使用して、必要なテーブルを見つける。
Question 248

時系列データを用いた分類問題に取り組み始め、数回の実験だけで訓練データに対して99%という受信者動作特性曲線下面積(AUC ROC)の値を得ました。高度なアルゴリズムの使用を検討したり、ハイパーパラメータのチューニングに時間を費やしたりしていません。問題を特定し修正するために、次に取るべきステップは何でしょうか?

A.
より複雑でないアルゴリズムを使用して、モデルの過学習に対処する。
B.
モデル訓練中にネストされた交差検証を適用することで、データ漏洩に対処する。
C.
目的値と高い相関のある特徴量を削除することで、データ漏洩に対処する。
D.
AUC ROC値を下げるようにハイパーパラメータを調整することで、モデルの過学習に対処する。
Question 249

あなたは、オンライン旅行代理店に勤務しており、その代理店は自社のウェブサイトで他社向けの広告掲載枠も販売しています。あなたは、ユーザーが次に閲覧すべき最も関連性の高いウェブバナーを予測するよう依頼されました。あなたの会社ではセキュリティが重要です。モデルのレイテンシ要件はp99で300ミリ秒、ウェブバナーの在庫は数千種類あり、探索的分析の結果、ナビゲーションコンテキストが有効な予測因子であることがわかっています。あなたは、最もシンプルなソリューションを実装したいと考えています。予測パイプラインをどのように構成すべきですか?

A.
クライアントをウェブサイトに埋め込み、その後モデルをAI Platform Predictionにデプロイする。
B.
クライアントをウェブサイトに埋め込み、ゲートウェイをApp Engineにデプロイし、その後モデルをAI Platform Predictionにデプロイする。
C.
クライアントをウェブサイトに埋め込み、ゲートウェイをApp Engineにデプロイし、ユーザーのナビゲーションコンテキストの書き込みと読み取りのためにデータベースをCloud Bigtableにデプロイし、その後モデルをAI Platform Predictionにデプロイする。
D.
クライアントをウェブサイトに埋め込み、ゲートウェイをApp Engineにデプロイし、ユーザーのナビゲーションコンテキストの書き込みと読み取りのためにデータベースをMemorystoreにデプロイし、その後モデルをGoogle Kubernetes Engineにデプロイする。
Question 250

あなたは、トレーニングジョブを送信するためにクラウドベースのバックエンドシステムを使用するデータサイエンティストのチームを管理しています。このシステムは管理が非常に困難になっており、代わりにマネージドサービスを使用したいと考えています。あなたが一緒に仕事をしているデータサイエンティストは、Keras、PyTorch、theano、Scikit-learn、カスタムライブラリなど、さまざまなフレームワークを使用しています。どうすればよいでしょうか?

A.
AI Platformのカスタムコンテナ機能を使用して、任意のフレームワークを使用するトレーニングジョブを受信します。
B.
Google Kubernetes Engine上でKubeflowを実行するように構成し、TF Jobを介してトレーニングジョブを受信します。
C.
Compute Engine上にVMイメージのライブラリを作成し、これらのイメージを中央リポジトリに公開します。
D.
Slurmワークロードマネージャーを設定して、クラウドインフラストラクチャで実行するようにスケジュールできるジョブを受信します。