Professional Machine Learning Engineer
あなたは最近、Vertex AI Pipelinesでパイプラインをデプロイし、モデルをトレーニングしてVertex AIエンドポイントにプッシュし、リアルタイムトラフィックを処理するようにしました。モデルのパフォーマンスを向上させるために、パイプラインの実験と反復を継続する必要があります。CI/CDにはCloud Buildを使用する予定です。新しいパイプラインを迅速かつ容易に本番環境にデプロイし、新しいパイプラインの実装が本番環境で失敗する可能性を最小限に抑えたいと考えています。どうすべきでしょうか?
あなたは厳格なデータガバナンス要件を持つ銀行に勤務しています。最近、不正取引を検出するためのカスタムモデルを実装しました。トレーニングコードが、プロジェクトのネットワークでホストされているAPIエンドポイントを使用して内部データをダウンロードできるようにしたいと考えています。データ漏洩のリスクを軽減しつつ、最も安全な方法でデータにアクセスする必要があります。どうすればよいですか?
あなたは、トラフィックを処理している本番環境のVertex AIエンドポイントに、モデルの新しいバージョンをデプロイしようとしています。すべてのユーザートラフィックを新しいモデルに向ける予定です。アプリケーションへの影響を最小限に抑えてモデルをデプロイする必要があります。どうすべきですか?
大規模なデータセットで機械学習モデルをトレーニングしています。トレーニングプロセスを高速化するためにTPUを使用しています。トレーニングプロセスが予想よりも時間がかかっていることに気づきました。TPUがその処理能力を最大限に活用できていないことが判明しました。どうすればよいですか?
あなたは小売企業に勤務しています。Vertex AIに、3つの異なる店舗の販売データを含むマネージド表形式データセットがあります。このデータセットには、店舗名や販売タイムスタンプなどのいくつかの特徴量が含まれています。このデータを使用して、間もなく開店する新店舗の販売予測を行うモデルを訓練したいと考えています。データを訓練セット、検証セット、テストセットに分割する必要があります。データを分割するにはどのアプローチを使用すべきですか?