Professional Machine Learning Engineer

Question 276

あなたは世界的な靴の小売業者で働いており、過去の在庫データに基づいて商品がいつ在庫切れになるかを予測する必要があります。靴の需要は多くのさまざまな要因に影響されるため、顧客の行動は非常に動的です。利用可能なすべてのデータでトレーニングされたモデルを提供したいと考えていますが、本番環境に展開する前に、特定のデータサブセットでのパフォーマンスを追跡したいと考えています。この検証を実行するための最も効率的で信頼性の高い方法は何ですか?

A.
TFX ModelValidatorツールを使用して、本番環境への準備状況に関するパフォーマンスメトリクスを指定する。
B.
k分割交差検証を検証戦略として使用して、モデルが本番環境に対応できることを確認する。
C.
関連する直近1週間のデータを検証セットとして使用して、モデルが現在のデータで正確に機能していることを確認する。
D.
データセット全体を使用し、受信者動作特性曲線下面積(AUC ROC)を主要なメトリクスとして扱う。
Question 277

Vertex AIにリアルタイム推論用のモデルをデプロイしました。オンライン予測リクエスト中に「メモリ不足」エラーが発生しました。どうすべきですか?

A.
オンラインモードの代わりにバッチ予測モードを使用する。
B.
より小さなインスタンスのバッチでリクエストを再送信する。
C.
予測に使用する前に、データをbase64でエンコードする。
D.
予測リクエスト数のクォータ増加を申請する。
Question 278

あなたはサブスクリプションベースの企業で働いています。あなたは、顧客が年間サブスクリプションを更新しない可能性である顧客離反を予測するために、木のアンサンブルとニューラルネットワークを訓練しました。平均予測では15%の解約率ですが、特定の顧客については、モデルはその顧客が70%の確率で解約すると予測しています。その顧客の製品利用履歴は30%で、ニューヨーク市在住、1997年に顧客になりました。あなたは、実際の予測である70%の解約率と平均予測との差を説明する必要があります。Vertex Explainable AI を使用したいと考えています。何をすべきでしょうか?

A.
個々の予測を説明するために、ローカル代理モデルを訓練する。
B.
Vertex Explainable AI でサンプル化されたShapley説明を設定する。
C.
Vertex Explainable AI で統合勾配法による説明を設定する。
D.
各特徴量の効果を、特徴量の重みと特徴量の値を掛け合わせたものとして測定する。
Question 279

あなたは時系列データを用いた分類問題に取り組んでいます。ランダム交差検証を用いて数回の実験を行っただけで、訓練データにおいて99%というROC曲線下面積(AUC ROC)の値を達成しました。まだ高度なアルゴリズムの使用を試みたり、ハイパーパラメータチューニングに時間を費やしたりしていません。問題を特定し修正するために、次に取るべきステップは何ですか?

A.
モデルの過学習に対処するため、より複雑でないアルゴリズムを使用し、k分割交差検証を使用する。
B.
モデル訓練中にネストした交差検証を適用することで、データ漏洩に対処する。
C.
目的変数と高い相関を持つ特徴量を削除することで、データ漏洩に対処する。
D.
AUC ROC値を下げるようにハイパーパラメータを調整することで、モデルの過学習に対処する。
Question 280

カスタムTensorFlow DNNリグレッサーモデルを使用して、BigQueryテーブル内の1億レコードに対してバッチ予測を実行し、予測結果をBigQueryテーブルに保存する必要があります。この推論パイプラインを構築するために必要な労力を最小限に抑えたいと考えています。どうすべきでしょうか?

A.
BigQuery MLでTensorFlowモデルをインポートし、ml.predict関数を実行する。
B.
TensorFlow BigQueryリーダーを使用してデータをロードし、BigQuery APIを使用して結果をBigQueryに書き込む。
C.
Dataflowパイプラインを作成してBigQueryのデータをTFRecordsに変換する。Vertex AI Predictionでバッチ推論を実行し、結果をBigQueryに書き込む。
D.
DataflowパイプラインにTensorFlow SavedModelをロードする。BigQuery I/Oコネクタとカスタム関数を使用してパイプライン内で推論を実行し、結果をBigQueryに書き込む。