Professional Machine Learning Engineer
オンライン予測のためにVertex AIにデプロイする予定のXGBoostモデルをトレーニングしました。現在、このモデルをVertex AI Model Registryにアップロードしており、オンライン予測リクエストに対して最小限のレイテンシで結果を返す説明メソッドを設定する必要があります。また、モデルの特徴量アトリビューションが時間とともに意味のある変化をした場合にアラートを受け取りたいと考えています。どうすればよいですか?
あなたは、Cloud Storageに数テラバイトの構造化データを持つゲームスタートアップ企業に勤務しています。このデータには、ゲームプレイ時間データ、ユーザーメタデータ、ゲームメタデータが含まれています。最小限のコーディングでユーザーに新しいゲームを推薦するモデルを構築したいと考えています。どうすべきでしょうか?
あなたは、米国とシンガポールで稼働しているGoogle Cloudでホストされたアプリケーションを通じて顧客にサービスを提供する大手銀行に勤務しています。取引が不正である可能性が高いかどうかを分類するためのPyTorchモデルを開発しました。このモデルは3層パーセプトロンであり、数値特徴量とカテゴリ特徴量の両方を入力として使用し、ハッシュ化はモデル内で行われます。 モデルをus-central1リージョンのnl-highcpu-16マシンにデプロイし、予測はリアルタイムで提供されています。モデルの現在の中央値応答レイテンシは40ミリ秒です。特に一部の顧客が最も長い遅延を経験しているシンガポールでのレイテンシを削減したいと考えています。どうすべきですか?
小規模なデータセットでXGBoostモデルをトレーニングする必要があります。トレーニングコードにはカスタム依存関係が必要です。トレーニングジョブの起動時間を最小化したいと考えています。Vertex AIカスタムトレーニングジョブをどのように設定すべきですか?
あなたは、さまざまなGoogle Cloudサービスを使用するデータ処理、モデルトレーニング、モデルデプロイのためのMLパイプラインを作成しています。個々のタスクごとにコードを開発済みであり、新しいファイルが高頻度で生成されることを見込んでいます。これらのタスクの上にオーケストレーションレイヤーを作成する必要があります。このオーケストレーションパイプラインは、Cloud Storageバケット内のデータセットに新しいファイルが存在する場合にのみ実行したいと考えています。また、コンピュートノードのコストも最小限に抑えたいです。どうすべきでしょうか?