Professional Machine Learning Engineer
あなたはscikit-learnを使用してカスタムMLモデルを構築しました。トレーニング時間が予想よりも長くなっています。モデルをVertex AI Trainingに移行し、モデルのトレーニング時間を改善したいと考えています。最初に何を試すべきですか?
あなたは小売企業のMLエンジニアです。カート内の商品に基づいて、チェックアウト時にeコマースの顧客に提供するクーポンを予測するモデルを構築しました。顧客がチェックアウトに進むと、Google Cloudでホストされているサービングパイプラインが、顧客の既存のカートと、顧客の過去の購買行動を含むBigQueryテーブルの行を結合し、それをモデルの入力として使用します。ウェブチームから、モデルが予測を返すのが遅すぎて、ウェブページの他の部分と一緒にクーポンオファーを読み込めないと報告がありました。モデルの予測を高速化するにはどうすればよいですか?
あなたは中小企業に勤務しており、本番環境でオンライン予測を提供するために、Vertex AI上で自動スケーリング機能を持つMLモデルをデプロイしました。現在のモデルは1時間あたり約20件の予測リクエストを受信し、平均応答時間は1秒です。あなたは新しいバッチデータで同じモデルを再トレーニングし、現在カナリアテストを実施しており、本番トラフィックの約10%を新しいモデルに送信しています。このカナリアテスト中に、新しいモデルへの予測リクエストの完了に30秒から180秒かかっていることに気づきました。どうすべきですか?
BigQueryに保存されている小さな公開データセットを使用して住宅価格を予測するAutoMLモデルをトレーニングしたいと考えています。データを準備する必要があり、最もシンプルで効率的なアプローチを使用したいです。どうすればよいですか?
あなたは、前処理とトレーニングのステップから構成されるVertex AI MLパイプラインを開発しました。各ステップ群は、個別のカスタムDockerイメージ上で実行されます。あなたの組織では、単体テストと統合テストを実行するために、CI/CDとしてGitHubとGitHub Actionsを使用しています。モデルの再トレーニングワークフローを自動化する必要があり、このワークフローは手動でも、新しいバージョンのコードがメインブランチにマージされたときにも開始できるようにする必要があります。ワークフロー構築に必要な手順を最小限に抑えつつ、最大限の柔軟性も確保したいと考えています。CI/CDワークフローはどのように設定すべきですか?