Professional Machine Learning Engineer
あなたは顧客離反を予測するBigQuery MLモデルを開発し、そのモデルをVertex AIエンドポイントにデプロイしました。モデルの特徴量の値が変化した際に、最小限の追加コードでモデルの再トレーニングを自動化したいと考えています。また、トレーニングコストを削減するために、モデルの再トレーニング回数を最小限に抑えたいと考えています。どうすべきでしょうか?
あなたはプロトタイプコードを本番環境にデプロイするタスクを任されました。特徴量エンジニアリングのコードはPySparkで記述されており、Dataproc Serverless上で実行されます。モデルトレーニングはVertex AIカスタムトレーニングジョブを使用して実行されます。これら2つのステップは連携されておらず、現在は特徴量エンジニアリングのステップが完了した後に、モデルトレーニングを手動で実行する必要があります。エンドツーエンドで実行され、ステップ間の接続を追跡する、スケーラブルで保守可能な本番プロセスを作成する必要があります。どうすればよいでしょうか?
最近、scikit-learnモデルをVertex AIエンドポイントにデプロイしました。現在、本番環境のライブトラフィックでモデルをテストしています。エンドポイントを監視していると、1日を通して予想の2倍のリクエスト数が1時間あたりに発生していることがわかりました。将来、需要が増加した際にエンドポイントが効率的にスケーリングし、ユーザーが高いレイテンシを経験するのを防ぎたいと考えています。どうすべきでしょうか?
あなたは銀行で働いています。銀行のベンダーから提供されたカスタムの表形式MLモデルがあります。トレーニングデータは機密性が高いため利用できません。このモデルはVertex AIモデルサービングコンテナとしてパッケージ化されており、各予測インスタンスの入力として文字列を受け付けます。各文字列では、特徴量の値はカンマで区切られています。あなたはこのモデルをオンライン予測のために本番環境にデプロイし、最小限の労力で時間の経過に伴う特徴量の分布を監視したいと考えています。どうすべきでしょうか?
あなたはGoogle Cloudでバッチ推論MLパイプラインを実装しています。モデルはTensorFlowを使用して開発され、Cloud StorageにSavedModel形式で保存されています。BigQueryテーブルに保存されている10TBのデータを含む履歴データセットにモデルを適用する必要があります。どのように推論を実行すべきですか?