Professional Machine Learning Engineer

Question 286

TensorFlowモデルの訓練時間のパフォーマンスをプロファイリングしたところ、Cloud Storage上にある単一の5テラバイトのCSVファイルデータセットの入力データパイプラインに非効率な点があり、パフォーマンスの問題が発生していることに気づきました。入力パイプラインのパフォーマンスを最適化する必要があります。パイプラインの効率を上げるために、最初に試すべきアクションはどれですか?

A.
入力CSVファイルをTFRecordファイルに前処理する。
B.
モデルを訓練するために、データからランダムに10ギガバイトのサブセットを選択する。
C.
複数のCSVファイルに分割し、並列インターリーブ変換を使用する。
D.
tf.data.Dataset.shuffleメソッドで、reshuffle_each_iterationパラメータをtrueに設定する。
Question 287

特定のミッションクリティカルな機械部品が故障するかどうかを判断するための非同期予測を提供するアーキテクチャを設計する必要があります。システムは、機械の複数のセンサーからデータを収集します。過去12時間の各センサーデータの平均値に基づいて、今後N分以内に故障が発生するかどうかを予測するモデルを構築したいと考えています。どのようにアーキテクチャを設計すべきですか?

A.
1. センサーからMLモデルにHTTPリクエストが送信されます。このモデルはマイクロサービスとしてデプロイされ、予測用のREST APIを公開しています。 2. アプリケーションは、モデルをデプロイしたVertex AIエンドポイントをクエリします。 3. モデルが予測を生成するとすぐに、呼び出し元のアプリケーションが応答を受信します。
B.
1. センサーからイベントがPub/Subに送信され、リアルタイムで消費され、Dataflowストリーム処理パイプラインによって処理されます。 2. パイプラインはモデルを呼び出して予測を行い、予測結果を別のPub/Subトピックに送信します。 3. 予測を含むPub/Subメッセージは、監視用の下流システムによって消費されます。
C.
1. Dataflowを使用してデータをCloud Storageにエクスポートします。 2. Cloud Storage内の訓練済みモデルを使用して、前処理済みデータに対してスコアリングを実行するVertex AIバッチ予測ジョブを送信します。 3. バッチ予測ジョブの出力をCloud Storageからエクスポートし、Cloud SQLにインポートします。
D.
1. BigQueryコマンドラインツールを使用してデータをCloud Storageにエクスポートします。 2. Cloud Storage内の訓練済みモデルを使用して、前処理済みデータに対してスコアリングを実行するVertex AIバッチ予測ジョブを送信します。 3. バッチ予測ジョブの出力をCloud Storageからエクスポートし、BigQueryにインポートします。
Question 288

あなたの会社は、多くの異なるオンラインソースからニュース記事を集約し、ユーザーに送信するアプリケーションを管理しています。あなたは、読者が現在読んでいる記事と類似した記事を提案する推薦モデルを構築する必要があります。どのアプローチを使用すべきですか?

A.
ユーザーの過去の行動に基づいて記事を推薦する協調フィルタリングシステムを作成する。
B.
word2vecを使用してすべての記事をベクトルにエンコードし、ベクトルの類似性に基づいて記事を返すモデルを構築する。
C.
各ユーザーに対して、記事を推薦すべきかどうかを予測するロジスティック回帰モデルを構築する。
D.
数百の記事を手動でラベル付けし、手動で分類された記事に基づいてSVM分類器を訓練し、追加の記事をそれぞれのカテゴリに分類する。
Question 289

あなたは、ユーザーが記事を投稿しニュースについて議論する大規模なソーシャルネットワークサービスプロバイダーで働いています。毎日数百万のコメントがオンラインに投稿され、200人以上の人間のモデレーターが常にコメントをレビューし、不適切なものをフラグ付けしています。あなたのチームは、人間のモデレーターがプラットフォーム上のコンテンツをチェックするのを助けるMLモデルを構築しています。モデルは各コメントをスコアリングし、疑わしいコメントにフラグを立てて人間によるレビューを促します。モデルのパフォーマンスを監視するために使用すべき指標は何ですか?

A.
モデルが1分あたりにフラグを立てたメッセージの数
B.
モデルが1分あたりにフラグを立て、人間によって不適切であると確認されたメッセージの数
C.
毎分、生のメッセージの0.1%のランダムサンプルを人間にレビューさせ、それに基づいて推定された適合率と再現率
D.
毎分、モデルが潜在的に不適切としてフラグを立てたメッセージのサンプルに基づいて推定された適合率と再現率
Question 290

あなたは小売企業のリードMLエンジニアです。チームがアーティファクトを生成することで再現性のある実験を行えるように、MLメタデータを一元的に追跡および管理したいと考えています。チームにどの管理ソリューションを推奨しますか?

A.
tf.loggingデータをBigQueryに保存する。
B.
Hiveメタストアですべてのリレーショナルエンティティを管理する。
C.
すべてのMLメタデータをGoogle Cloudのオペレーションスイートに保存する。
D.
Vertex ML MetadataでMLワークフローを管理する。